科学家设计AI系统从无声钢琴演奏视频中再现演奏声音
2021-02-13 07:44:35AI云资讯1283
据外媒New Atlas报道,想象一个计算机程序能够直观地识别出在无声的钢琴演奏视频中演奏的是哪首乐曲,或许并不夸张。然而, 一个新的人工智能系统却更进一步,以数字方式逼真地再现了钢琴演奏的声音。

这项技术被称为Audeo,由华盛顿大学 的一个团队设计。研究人员使用钢琴家保罗·巴顿的YouTube视频对系统进行了培训和测试。培训包括约17.2万巴顿演奏巴赫和莫扎特等著名古典作曲家音乐的视频帧。
在分析一段无声视频时,所产生的系统首先会观察哪些键被按下的顺序,确定各个音符及其排列方式。也就是说,它还能感知到每个键被击打的力度和被按住的时间--这让它能计算出每个音符的强度,以及它在随后弹奏的音符下面持续的时间长度。它还考虑到了钢琴独特的声学特性。然后,这些数据被转换为一种可以被现有的数字合成器理解的格式。据报道,当该合成器回放音乐文件时,它听起来非常像原始的钢琴音乐。
在对Audeo的测试中,它的任务是根据巴顿演奏的静音视频重现钢琴音乐,而不是系统所训练的音乐作品。当SoundHound等音乐识别应用分析这些再现时,它们能够以大约86%的准确率识别出乐曲。相比之下,当这些应用分析相同视频中的原始钢琴音频时,其识别准确率攀升至93%。随着技术的进一步发展,这种差距应该会缩小。
“我们希望我们的研究能够实现与音乐互动的新方法,”该研究的高级作者EliShlizerman副教授说。“例如,未来的一个应用是,Audeo可以扩展到虚拟钢琴,摄像头只记录一个人的手。此外,通过将摄像头放在真实的钢琴之上,Audeo有可能协助教学生如何演奏的新方法。”
相关文章
- 米拉董事长领航AI集选联盟,生态赋能破局商业与就业
- 韦达ai快讯丨拒绝“数字摆设”:从韦达技术实践看企业数字化转型的务实路径
- 博库致连AI文档管理一体机:定义AI存储新模式
- 红数据×灵积引擎×豹播:茉莉数科AI产品矩阵如何打通营销全链路
- 亿咖通科技发布Zenith(天极)计算平台,推动AI中央计算全球生态
- 直击奢侈品仓储履约痛点!极智嘉三度携手雷诺斯,AI机器人方案成最优解
- 智慧运营新标杆!浩鲸科技携手安徽电信共建AI校园
- 三维天地推出多模态数据湖产品SW-DBLake,重新定义AI时代的数据基石
- 福客AI获电商AI创新实践大赛决赛冠军,验证客服场景落地能力
- 协创数据2025年业绩预增超50%:存储算力双轮驱动 构筑AI基建核心竞争力
- AI盯牢养老院后厨 湖北移动守护银龄“舌尖”安全
- 众擎机器人×锋物科技:“具身智能机器人+Ai大脑”开启安防4.0时代
- 苹果史上第二大交易:将以20亿美元收购音频初创公司Q.ai
- 马斯克的SpaceX与xAI或将合并,有助于推进太空数据中心发射计划
- 华为云黄瑾:做难而正确的事,用AI解行业难题
- AMD与高通计划追随英伟达,下一代AI产品也将采用SOCAMM内存









