头部人工智能训练数据专业提供商海天瑞声即将启动申购
2021-07-31 07:59:00AI云资讯1592
8月3日,北京海天瑞声科技股份有限公司(以下简称“海天瑞声”)将进行网上网下申购。此次发行1,070万股,占发行后总股本的比例25%。申购价格36.94元/股。

在AI产业链中,算法、算力和数据共同构成技术发展的三大核心要素。在当前人工智能行业发展进程中,有监督的深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的支撑则是有监督的深度学习算法实现的基础,训练数据已成为算法模型发展和演进的“燃料”。
全球基础数据服务行业处于快速成长期,市场规模具有较大的增长空间。当前我国人工智能产业加速发展,2019年,中国人工智能行业的融资总额约为166亿美元,占全球的44.39%,位居全球首位。应用场景的创新和机器学习算法的流行直接带动了训练数据需求的大幅增长。
针对AI产业对训练数据的需求,自2005年成立以来,海天瑞声始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。在多年的行业实践过程中,海天瑞声始终注重充分挖掘和培养自身的核心技术优势,自主开发了一体化数据处理平台,在基础研究、平台工具、训练数据生产三个维度均积累下核心技术。除拥有先进的算法与数据处理技术和自主开发一体化数据处理平台外,海天瑞声还在语音语言学基础研究方面有深厚积累。通过多年经营积累,公司已具备全球160余个语种/方言的训练数据设计开发能力,并掌握了N元语言模型训练与优化技术、文本正则化技术、基于语言模型的文本易读性评测技术等算法技术,可结合音素均衡、语料主题、覆盖领域、发音人属性、设备特征等因素综合设计满足算法模型开发、训练、拓展需要的训练数据集。
海天瑞声高度重视并坚持科技创新,且十分重视研发团队的知识结构和梯队建设,现有团队皆为相关专业硕士与博士以上成员构成,专业扎实、技术先进、经验丰富。截至目前,海天瑞声已获得24项发明专利授权、1项实用新型专利授权及1项外观设计专利授权,涉及基础算法研究领域、数据处理领域等,技术储备充足。截至2020年12月31日,公司拥有760余个类型丰富的自有知识产权的高品质工程化训练数据集,能够为我国AI自主技术研发提供高质量的训练数据保障。
基于丰富的技术积累和行业经验,海天瑞声提供的训练数据产品及相关服务已覆盖三大技术领域、多个语种/方言和多项应用场景,赢得了阿里巴巴、腾讯、百度、微软、三星、亚马逊、科大讯飞、商汤科技、中国科学院、清华大学等众多大型优质客户的认可,核心技术、产品资源、优质客户等竞争优势逐步凸显。
凭借优秀的产品品质、先进的技术和周到的服务,海天瑞声已经成为中国基础数据服务行业的头部企业,市场份额位居行业前五,同时在中国语音类基础数据服务领域排名第一。在持续多年的研发投入和努力下,海天瑞声荣膺多项资质荣誉,先后获得国家重点软件企业、国家高新技术企业、中关村高新技术企业等资质,参与了国家、行业标准的起草工作。2020年,获评工信部国家专精特新“小巨人”企业;2021年,获评工信部“新一代人工智能产业创新重点任务揭榜优胜单位”,系全国唯一一家获此殊荣的AI数据企业。
海天瑞声将以本次IPO为全新的起点,未来将继续以数据为核心稳步发展,持续依靠自身技术积累,通过引入资本和人才等手段升级技术水平、扩大公司业务规模,持续建设、优化、创新训练数据服务,完善公司的产品体系,提升通用训练数据产品、训练数据定制服务等主线业务的领先优势,增强数据驱动人工智能行业发展的能力。
相关文章
- 全国人工智能发展大会 AI HANGZHOU 2026中国(杭州)国际人工智能展览会
- 亿达科创亮相国际人工智能展再获AI大奖
- 欢聚旗下百果园网络入选2025广州人工智能创新发展榜单
- 自主可控 智测未来|科大讯飞人工智能终端测试中心正式揭牌
- 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本
- 第九届数字中国建设峰会分论坛“人工智能产业发展和赋能新型工业化”主题交流活动在福州圆满落幕
- IBM咨询扩展人工智能能力,加速企业转型
- 点猫科技与新加坡华侨中学签署人工智能教育合作备忘录
- 许欢:人工智能应急大模型开启应急管理新发展时代
- 人工智能终端迎来“国家标尺” 联想以规模化产品实践助力标准编制
- SpaceX拟在得克萨斯州建设人工智能芯片工厂,总耗资达1190亿美元
- 微软放弃Xbox Copilot人工智能
- 人工智能助力新型工业化 第九届数字中国建设峰会工业智能产业生态大会成功举办
- 中兴通讯携手印尼XLSMART 在雅加达正式启动联合创新中心加速印尼 5G-Advanced 与人工智能发展与应用
- 马斯克出庭作证,诉讼指控OpenAI违背了打造惠及全人类的通用人工智能的核心使命
- 实力登榜!思特奇入选2026全国企业“人工智能+”行动创新案例TOP100
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









