科学家设计AI系统从无声钢琴演奏视频中再现演奏声音
2021-02-13 07:44:35AI云资讯1236
据外媒New Atlas报道,想象一个计算机程序能够直观地识别出在无声的钢琴演奏视频中演奏的是哪首乐曲,或许并不夸张。然而, 一个新的人工智能系统却更进一步,以数字方式逼真地再现了钢琴演奏的声音。
这项技术被称为Audeo,由华盛顿大学 的一个团队设计。研究人员使用钢琴家保罗·巴顿的YouTube视频对系统进行了培训和测试。培训包括约17.2万巴顿演奏巴赫和莫扎特等著名古典作曲家音乐的视频帧。
在分析一段无声视频时,所产生的系统首先会观察哪些键被按下的顺序,确定各个音符及其排列方式。也就是说,它还能感知到每个键被击打的力度和被按住的时间--这让它能计算出每个音符的强度,以及它在随后弹奏的音符下面持续的时间长度。它还考虑到了钢琴独特的声学特性。然后,这些数据被转换为一种可以被现有的数字合成器理解的格式。据报道,当该合成器回放音乐文件时,它听起来非常像原始的钢琴音乐。
在对Audeo的测试中,它的任务是根据巴顿演奏的静音视频重现钢琴音乐,而不是系统所训练的音乐作品。当SoundHound等音乐识别应用分析这些再现时,它们能够以大约86%的准确率识别出乐曲。相比之下,当这些应用分析相同视频中的原始钢琴音频时,其识别准确率攀升至93%。随着技术的进一步发展,这种差距应该会缩小。
“我们希望我们的研究能够实现与音乐互动的新方法,”该研究的高级作者Eli Shlizerman副教授说。“例如,未来的一个应用是,Audeo可以扩展到虚拟钢琴,摄像头只记录一个人的手。此外,通过将摄像头放在真实的钢琴之上,Audeo有可能协助教学生如何演奏的新方法。”
相关文章
- 科大讯飞获首届“AI领航杯”大赛技术创新奖及“AI+安全”赛道一等奖
- 博大数据荣登“2025中国AI算力领域最具商业潜力榜”:以融合算力基础设施,夯牢智能时代数字基石
- AI落地总踩坑?浪潮云海InCloud AIOS:让AI落地省心、省钱、持续增值
- 浪潮云海InCloud AIOS一体化AI解决方案正式发布,推动大模型规模化落地
- AI 能效驱动渠道生态革新,深度智控奔赴 “十五五” 绿色发展
- 中兴通讯CDO崔丽出席《经济学人》AI创新亚洲峰会2025
- 全球数据周Tech Week Shanghai 2026即将启幕:打造亚太数据枢纽,引领全球数字创新浪潮
- Elo I系列5.0安卓触控一体机发布,开启AI时代商业终端新篇章
- “AI 教父”Hinton与云天励飞陈宁在AI十字路口的握手—从“能力恐慌”到“普惠共识”
- AI新云破局与算力普惠:中国智算产业的2025分水岭
- 瑞声科技:豆包 AI手机核心供应商,合作多家海外大模型企业
- 超聚变专用计算旗舰产品X3智能工作站,搭载NVIDIA驱动打造AI就绪算力
- 亿道信息以“AI+终端”与“AI+应用”双轮驱动,开启智能普惠新纪元
- 顺丰科技联合华为:用AI和数智基础设施构建智慧物流的未来
- 宜选网亮相印尼雅加达机床展,“AI采购”解决方案塑造跨境贸易新体验
- 《中国AI+互联网媒体行业研究报告》发布深度解析AI重塑媒体生态









