爱奇艺M2VOC挑战赛6篇论文被ICASSP2021收录,少样本语音克隆取得重要成果
2021-06-11 17:50:36AI云资讯1528
近年来,迁移学习、风格迁移、声码器、声学模型等方面的最新进展,为低资源语音克隆的提供了潜在的解决方案。
爱奇艺联合西北工业大学音频语音与语言处理研究组、新加坡国立大学、清华大学深圳国际研究生院、起源智能、希尔贝壳在ICASSP2021举办了多说话人多风格音色克隆大赛——M2VoC。
M2VoC挑战赛旨在提供一个通用的数据集以及一个公平的测试平台,对语音克隆任务进行研究。作为2021年声学、语音和信号处理国际会议(ICASSP2021)信号处理挑战旗舰任务之一,吸引了多支学术界和工业界的研究人员加入了挑战。
本周,在ICASSP2021峰会上,M2VoC挑战赛顺利落幕,并公布了比赛成果。共153只队伍注册参赛了本次挑战赛,其中有多家学术机构和互联网公司共同参与其中,学术机构包括北京大学,清华大学,浙江大学,上海交通大学,国立台湾大学,哈工大,University of Crete,中科院自动化所,University of Tsukuba,Nagoya University,复旦大学,香港中文大学,中科院大学,电子科技大学等;参与互联网公司包括虎牙,微软,滴滴,腾讯,网易等。
爱奇艺多说话人多风格音色克隆大赛分为少样本赛道和极少样本赛道两大任务。在少样本赛道方面,主办方针对每个说话人提供100句不同说话风格的训练样本;在极少样本赛道方面,主办方针对每个说话人提供5句不同说话风格的训练样本;同时,主办方提供了两个基础库,分别包含5000句不同说话风格的训练样本,供参赛者训练基础模型。最终,主办方经过“说话人相似度、语音质量、风格/表现力、发音准确率”四大标准加权作为比赛评判标准。
针对提交成果,爱奇艺组委会进行了两轮主观评估:第一轮包括所有团队的提交,第二轮则对几个得分最高的团队进行了进一步评估。每个赛道的最终获胜者是根据两轮比赛的综合结果选出的。考虑到在短时间内对质量、风格和相似度进行主观评价的巨大成本,组委会采用了抽样评价方法。第一轮和第二轮主观听力测试分别有66名和30名专业听测人员参加。所有的听测人员都是以汉语为母语,由语言学专业的大学生和专业的语音注释员组成。

图:赛道一提交的MOS

图:赛道二提交的MOS
比赛汇集了业内顶尖团队,作为业内首个多说话人多风格音色克隆比赛,体现了当前业内和学界最高水平。本次挑战赛共收录18篇相关论文,其中,6篇论文被ICASSP2021收录。
本次挑战赛收录的6篇论文下载链接:
https://2021.ieeeicassp.org/Papers/ViewSession.asp?Sessionid=1304

图:ICASSP 2021本次挑战赛收录论文
参赛队伍在Acoustic model、Speaker representation、Vocoder、Speaker adaptation strategy等多个方面都提出了创新,并取得了很好的效果。相关成果应用于APP口播、UGC配音、有声书、风格化语音合成等多个应用场景,能够满足不断变化的声音定制场景,特别是基于多风格低质量语料场景下的声音的定制。

图:各赛道第一轮评估中所有提交的MOS
本次爱奇艺多说话人多风格音色克隆大赛(M2VoC)是世界上第一个小资源音色克隆挑战赛,旨在为语音克隆任务的研究提供一个通用的数据集和一个公平的测试平台。挑战展示了当前语音克隆技术的性能:随着深度学习的进步,少样本语音克隆已经取得了相当好的性能,但单样本语音克隆仍然是一个未解决的问题。在现实世界的语音克隆应用中,低质量(嘈杂)音频和训练/适应/推理的时间/成本限制也是不可忽视的重要因素。
爱奇艺也在ICASSP2021发布了相关论文,总结本次大赛的情况。希望通过本次大赛的成果,为音色克隆、语音识别等前沿技术的创新探索提供更多机会,进一步拓宽人工智能技术的应用空间,为视听行业发展提供新的可能。
相关文章
- 爱奇艺揽获2025中国国际广告节23项大奖 以IP共振强化品牌认同
- 爱奇艺世界·大会动漫2026年度发布:构建AI时代共创共赢国漫生态,28部片单重磅亮相
- 2026 爱奇艺纳逗・AIGC创投大会圆满落幕,六部AIGC影视佳作脱颖而出
- 2026爱奇艺少儿产业创新论坛:转型IP生态商业平台,发布多部重点AIGC片单
- 爱奇艺龚宇出席中国网络视听大会:AI振兴影视行业每一帧
- 爱奇艺首部AIGC电影短片《天问》背后:AI让创作者从“不敢想”到“做出来”
- 爱奇艺《逐玉》圆满收官,50+品牌合作、全链路变现彰显IP硬实力
- 华中首家!爱奇艺乐园将落地武汉
- 终于等到!鸿蒙版爱奇艺3.3.0版本把云包场、特效弹幕等全安排上了
- 爱奇艺龚宇:AI推动平台去中心化转型 与制作方的合作将以分账为主
- 爱奇艺发布“法眼剧场”微剧合作规划 创作者产业园落地南京
- 现实主义大剧《生命树》开播发布会在京举行 1月30日爱奇艺全网独播
- 爱奇艺开年大剧《生命树》定档1月30日,品牌抢占CNY营销价值高地
- 爱奇艺《太平年》1月23日播出,讲述五代十国“纳土归宋”的历史故事
- 反套路穿书“天花板”回归,爱奇艺动漫《成何体统 第2季》1月25日开播
- 爱奇艺分账剧《老舅》首月分账破5500万元,创造两项行业纪录
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由









