十方融海产学研项目通过验收,复杂场景AI语音识别技术取得突破性进展
2026-03-27 13:26:29AI云资讯1296
近日,深圳十方融海科技有限公司举办《复杂场景说话人智能识别技术研发》项目验收会,对其子公司新智未来委托广东工业大学开展的产学研合作项目进行全面评审。经过双方共同钻研,项目全部技术指标达成,部分核心数据超出预期目标,标志着十方融海在AI语音交互领域的产学研深度布局再获实质性成果。

说话人识别技术是通过分析语音信号中的个性特征来确认说话人身份的关键技术,在智能家居、金融认证、安防监控等领域具有广泛的应用前景。然而,在真实家庭场景中,环境噪声、家庭成员声学特征差异较小、用户注册样本有限等现实因素,始终是制约该技术从实验室走向落地的核心瓶颈。十方融海正是瞄准这一行业痛点,联合广东工业大学开展了针对性的技术攻关。
验收数据显示,项目在多项核心指标上取得了突破性进展。在精度方面,5人注册场景下系统等错误率(EER)较基线方案降低了近8%,超过预期的5%目标;在响应速度方面,基于NVIDIAL20显卡的端到端推理时间达到42毫秒,满足实时交互需求;在小样本能力方面,系统实现单用户仅需3至5条语音即可完成快速注册并精准识别,大幅降低了用户使用门槛;在拒识能力方面,包含50%未知用户干扰的测试集中,系统拒识准确率达到93.86%,有效解决了开放集场景下未注册用户的干扰问题。
在技术攻关层面,项目成果涵盖多项创新突破。研究团队研发了融合熵置信度正则化的动态可学习嵌入表示矩阵,解决了传统原型网络在极少样本时中心估计偏移的问题;引入AM-Softmax损失函数增强特征空间的类间距离,并结合家庭成员分布特性设计了自适应动态拒识阈值;同时针对高采样率音频优化了特征提取与模型前向推理流程,适配L20高性能算力平台。上述三项核心技术的协同突破,使得复杂场景下的说话人识别在精度、鲁棒性与实时性上实现了显著提升。
在验收会上,企业表示该项技术成果已成功集成至"小智-ESP32"系列产品的后端服务体系中。小智AI是十方融海旗下子公司新智未来自主研发的开源AI语音交互系统,自上线以来迅速跃居GitHubTrending榜首位,累计吸引超过10万名开发者参与生态建设,接入设备量超过120万台,日均处理对话量达900万条。2025年12月,小智AI项目成功入选深圳市打造人工智能先锋城市项目扶持计划(第一批)中的"人工智能软件开源奖励专项"。
此次说话人识别技术的落地应用,有效提升了语音助手对不同家庭成员指令的识别精度与响应速度,使系统能够根据说话人身份动态调整音色、语速、推荐内容及交互方式,为用户提供差异化的个性化交互体验。复杂场景说话人识别技术的突破,为AI语音交互打开了广阔的商业应用空间。
验收会议期间,双方还围绕AI语音交互产品的未来发展方向展开了深入研讨。与会双方表示,从智能家居到智慧教育,从养老陪护到车载终端,精准的身份识别是一切个性化服务的入口——只有"认出谁在说话",才能"懂他说什么、需要什么"。随着该项目成果的大规模部署推进,企业在语音交互领域的差异化竞争优势将进一步凸显,小智AI系列产品将构建差异化的技术竞争壁垒,商业落地前景值得期待。
当前,国务院《关于深入实施"人工智能+"行动的意见》正加速推动AI技术赋能千行百业,深圳也在全力打造人工智能先锋城市。十方融海此次产学研合作项目的顺利验收,正是企业响应国家战略、投身地方产业建设的具体实践;也为AI语音技术在智能家居场景下的商业化应用提供了可复制的产学研协同范式。未来,十方融海将继续深化产学研协同合作,持续推动AI语音技术从实验室走向更广泛的真实应用场景,为智能语音交互产业的高质量发展贡献力量。
相关文章
- 十方融海产学研项目通过验收,复杂场景AI语音识别技术取得突破性进展
- 图像处理、语音识别的经验案例:西安羲和
- Scale AI语音识别技术落地微软,AI语音领域再添里程碑
- 天玑9400首发端侧AI语音识别技术,打造《破碎之地》随行AI NPC
- 语音识别上难度 讯飞输入法免切换识别多语种多方言不迷糊!
- 量身定制 精准识别,标贝科技语音识别定制方案助力企业智慧升级
- vivo携手昆仑芯、wenet助力提升语音识别效果与性能,共建开源生态
- 说话秒变笔记!讯飞语记能“连续语音识别速记”
- 出门问问联合发布全球最大多领域中文语音识别数据集WenetSpeech
- 从语音识别到AI拍摄,骁龙人工智能算力覆盖手机体验方方面面
- AI助手查余额,思必驰语音识别支持10多种方言
- 197亿美元现金!微软宣布收购语音识别巨头Nuance
- 谷歌发布新一代定向人声分离系统,2.2MB模型提升设备端语音识别
- 小米MIUI新增字幕模式,语音识别更加懂你
- 用人工智能打通K12语音识别市场,「先声智能」实力加码在线教育细分赛道
- 讯飞智能键盘首发离线语音识别,颠覆你对键盘的所有想象









