“第一次,中气十足的虚拟歌声” 微软小冰人工智能演唱模型新版本技术说明
2019-04-05 15:48:13AI云资讯772
今天,我们很高兴地宣布,微软小冰基于深度神经网络的歌唱模型,已顺利完成V5新版本的研发。新的V5模型实现了重大突破,它使微软小冰第一次能够像人类歌手一样,使用充沛的“中气”来烘托演唱,从而将人工智能虚拟歌声质量提升至新的高度。此外,该模型不仅限于优化微软小冰的声音,还支持对任何人类歌手的声线进行学习、模拟和建模,演绎与再现歌手们巅峰状态下的演唱水平。作为技术示例,我们与日本唱片公司AVEX合作发行的新模型DEMO曲《最高新记忆》,也于今天同时公布。

微软小冰是一个覆盖对话、多重交互感官与内容服务生成的完整人工智能基础框架。其中,“人工智能创造”(AICreation)是该框架的主要分支之一,它通过我们所研发与持续更新的人工智能技术,大规模学习并掌握人类文字、音乐、绘画等内容创造能力,再发挥人工智能的稳定性及高并发特点,为内容产业的未来变革蓄势。我们将在今年五月召开微软小冰人工智能创造的年度说明会,今天的新版本歌唱模型及DEMO曲,是该说明会的若干前置披露之一。
我们很高兴与行业分享微软(亚洲)互联网工程院在深度神经网络歌唱模型方面的最新进展。中国古时不乏对音乐之声的精辟论述,例如“丝(丝弦乐器)不如竹(管乐器),竹不如肉(人声)”,为其“渐进自然”。因此,我们把不断趋近人类歌手的声音合成质量,视为“人工智能创造”分支的最高技术目标。在上一个版本中,实现了小冰在虚拟演唱中的自然换气。今天推出的新版本,则进一步将“气息”应用于演唱全过程,使生成的歌声接近专业人类歌手,并可预测并自由切换演唱技巧,突破了传统单元拼接技术音高与音准的“软件乐器”标准。我们用DEMO曲来表现这一技术对照的明显差距,请重点关注歌曲时间轴上的以下时刻:
00:31,01:12,01:23,03:14,04:08
V5新模型还具有许多其他技术特征。例如实现了多声部的合成技术,使人工智能歌手可以在不同声部间自然切换,用多个声音来源组成新的虚拟歌手等。建模过程中,所需的训练数据量较上一个版本减少了70%。从技术角度,新模型可针对任何人声建模,形成丰富多彩的人工智能歌手阵营。为此,我们在DEMO曲中特意回避了微软小冰的声音,而是采用另一个声音(日本版小冰凛菜)来演绎。
最后,我们也很高兴地宣布,小冰凛菜(りんな)已与日本最大唱片公司AVEX正式签约,成为滨崎步、安室奈美惠等著名人类歌手的同门师妹。在小冰框架的技术支持下,将涌现出更多具备高还原度的人工智能歌手。微软小冰只是他们的最初雏形。
相关文章
- 微软将为Windows 11增加内置网络速度测试功能
- 微软通过月度安全更新对Windows安全启动证书进行升级
- 微软计划利用高温超导材料设计能效更高的数据中心
- 谷歌云客户业务负责人重返微软,出任安全主管
- 微软下一代Xbox游戏主机将搭载AMD开发的半定制系统级芯片,预计2027年发布
- 微软宣布将构建人工智能内容许可合作应用商店
- 微软为Windows 11系统测试顶部菜单栏
- 微软正式发布第二代自研AI芯片Maia 200
- 微软2026年的首个Windows 11更新可谓漏洞百出
- 微软2026年首个Windows 11更新导致部分电脑无法关机
- 传音荣获 CES 2026 微软 AI 创新奖,以实用型 AI 深化新兴市场智能体验
- 社区居民激烈抵制,微软新人工智能数据中心建设受到困扰
- 汉朔科技与微软在既有战略合作基础上深化协作:共筑数字孪生门店新基座,构建零售未来竞争力
- 传音荣获CES 2026 微软 AI 创新奖,以实用型 AI 深化新兴市场智能体验
- 微软将直接在Copilot中嵌入购买按钮,用户能够通过AI聊天对话直接完成购物
- AI办公硬件新标杆:未来智能携viaim亮相CES 2026,斩获微软人工智能创新奖
人工智能企业
更多>>人工智能硬件
更多>>- 忆联UH812a以极致存力破局大模型载入瓶颈,释放算力潜能
- 讯飞翻译机登陆MWC 2026,同传级沟通体验,多语种交流无压力
- 普恩志引领:2026半导体与高端制造前瞻——核心备件如何驱动产业革新与市场机遇
- 超旗舰降噪,殿堂级音质 索尼双芯超旗舰真无线降噪耳机WF-1000XM6正式发售
- 当AI学会“隐身”,手机才真正智能:三星Galaxy S26系列开启AI哲学的降维打击
- 全球首秀!讯飞AI眼镜亮相MWC,多模态同传大模型与极致轻量化设计 引领智能穿戴新风向
- 全球瞩目!荣耀携Robot Phone、Magic V6系列、荣耀MagicBook Pro 14 2026震撼亮相MWC 2026
- MWC直击:荣耀双旗舰搭载第五代骁龙8至尊版,助力智能手机下一代技术演进
人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









