杭州语料库发布首批50个高质量数据集!
2025-12-17 12:08:52AI云资讯2058
近日,在浙江省数据局指导下,杭州市数据资源管理局联合杭州市数据集团等单位,通过“揭榜挂帅”机制,正式发布首批50个杭州语料库高质量数据集建设先行先试清单。
这项覆盖医疗健康、工业制造、交通运输、文化旅游等14个新兴产业领域的清单,标志着数据要素从资源化到资产化的关键一步。
在工业制造领域,有聚焦智能质检的视觉数据集;在医疗健康领域,有涵盖疾病诊断辅助的医学影像数据;在教育培训领域,景联文科技构建的含5637万道结构化英文试题的《教育大模型英语知识数据集》也成功入选,展示了垂直领域专业化数据集的商业潜力。该数据集针对教育大模型训练需求,系统整合了英语学科知识体系,覆盖听力、阅读、写作等多个维度。

这些数据集不仅体量大、质量高,更关键的是具有明确的应用场景和商业价值,能够直接服务于产业数字化转型需求。
“专业化、场景化、合规化是高质量数据的三大特征,”一位数据产业分析师评论道,“未来数据市场的竞争,将是质量与专业度的竞争,而非单纯的数据规模比拼。”
景联文的入选,反映了市场对深耕特定领域、提供深度价值数据产品的服务商的认可。这种专业化路径可能成为数据企业差异化竞争的重要方向。
杭州的这一实践不仅仅是一次简单的数据清单发布,更是构建完整数据要素生态系统的关键尝试。从数据采集、加工、确权到交易、应用,形成闭环。随着这批高质量数据集逐步进入流通环节,它们将像种子一样,在各行各业生根发芽,催生新的应用、新的模式、新的价值。
相关文章
- 北京数据集团旗下数字认证举办信任互联合作伙伴大会 共启数据要素新征程
- 上海数据集团、阿里云、浩鲸科技深化战略合作 发力AI时代数据要素
- 中科天机高质量气象数据集上线魔搭社区,携手共建科学智能新生态
- 六大标杆成果集中亮相 湖北大数据集团第二个“百日攻坚”为全省数智经济发展注入新动能
- 全球最大规模!如视开源室内三维数据集Realsee3D
- 杭州语料库发布首批50个高质量数据集!
- 四维图新联合北京车网发布首个“双智”时空要素数据集
- 聚焦数据基石,共筑AI生态——“数据集和语料库赛道对接洽谈会”成功举办
- 突破具身智能「最后一公里」:灵巧智能首发DexCanvas数据集,破解机器人“手笨”难题!
- 破具身智能「最后一公里」:灵巧智能首发DexCanvas数据集,破解机器人“手笨”难题!
- 共筑智算新高地,九章云极携手扬州大数据集团、扬州广陵新城投资发展集团达成战略合作
- 新起点 新征程│数字认证正式并入北京数据集团!
- 老板电器入选国家首批高质量数据集建设试点,打造厨电行业“数据教科书”
- 亿信华辰数据治理解决方案助力构建高质量数据集
- 每日互动联手济南大数据集团 共筑数据要素安全流通新生态
- 全球数字经济大会 亿海蓝入选首批北京市高质量数据集
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由









