网易AI Lab斩获全球顶级声纹识别竞赛冠军
2020-07-23 10:44:38AI云资讯1368
7月23日电 近日,全球最大的语音会议 INTERSPEECH 2020 公布了SdSV 声纹识别比赛成绩,网易AI Lab从众多国际顶级队伍中脱颖而出,获文本相关声纹识别赛道 综合排名第一、单模型第一的双料冠军。彰显了网易 AI Lab在语音声纹识别技术领域的领先地位。
本次国际声纹识别比赛的参赛队伍来自国际多家知名高校与企业,包括近两年全球各项声纹识别比赛中的“常胜将军”:布尔诺工业大学、新加坡通信研究院、 约翰霍普金斯大学等。

比赛中,网易AI Lab基于常见的X-Vector和PLDA算法,创新地提出了一种 ASR-free的文本相关声纹识别算法。相比传统的Deep Speaker Embedding方法,该算法不需要依赖语音识别, 就能够在多语言环境下,同时完成说话人和文本内容的验证。
比赛采用MinDCF(最小检测代价)和EER(等错误率)作为评测指标。网易AI Lab 的单模型在两个指标均为最佳,其中EER达到了1.67%,相比第二名降低了11.6%,并远低于比赛 X-Vector基线系统(EER=9.05%)。EER是判断声纹识别算法系统的综合指标,EER 越小,系统性能越佳。
声纹识别技术多应用于安防等场景中,而网易AI Lab声纹识别技术其实早已被运用于游戏场景中。除了进行游戏身份验证,还能够针对音色对用户进行分类、丰富玩家画像,从而更加精准地为玩家推荐志趣相投的好友、匹配实力相当的对手,为玩家带来更好的游戏体验。
相关文章
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









