科学家设计AI系统从无声钢琴演奏视频中再现演奏声音
2021-02-13 07:44:35爱云资讯1026
据外媒New Atlas报道,想象一个计算机程序能够直观地识别出在无声的钢琴演奏视频中演奏的是哪首乐曲,或许并不夸张。然而, 一个新的人工智能系统却更进一步,以数字方式逼真地再现了钢琴演奏的声音。
这项技术被称为Audeo,由华盛顿大学 的一个团队设计。研究人员使用钢琴家保罗·巴顿的YouTube视频对系统进行了培训和测试。培训包括约17.2万巴顿演奏巴赫和莫扎特等著名古典作曲家音乐的视频帧。
在分析一段无声视频时,所产生的系统首先会观察哪些键被按下的顺序,确定各个音符及其排列方式。也就是说,它还能感知到每个键被击打的力度和被按住的时间--这让它能计算出每个音符的强度,以及它在随后弹奏的音符下面持续的时间长度。它还考虑到了钢琴独特的声学特性。然后,这些数据被转换为一种可以被现有的数字合成器理解的格式。据报道,当该合成器回放音乐文件时,它听起来非常像原始的钢琴音乐。
在对Audeo的测试中,它的任务是根据巴顿演奏的静音视频重现钢琴音乐,而不是系统所训练的音乐作品。当SoundHound等音乐识别应用分析这些再现时,它们能够以大约86%的准确率识别出乐曲。相比之下,当这些应用分析相同视频中的原始钢琴音频时,其识别准确率攀升至93%。随着技术的进一步发展,这种差距应该会缩小。
“我们希望我们的研究能够实现与音乐互动的新方法,”该研究的高级作者Eli Shlizerman副教授说。“例如,未来的一个应用是,Audeo可以扩展到虚拟钢琴,摄像头只记录一个人的手。此外,通过将摄像头放在真实的钢琴之上,Audeo有可能协助教学生如何演奏的新方法。”
相关文章
- AR智能眼镜催化万亿市场,Meta/微美全息驱动“AR+AI”产业生态爆发式增长
- 华硕无畏家族跨界联动《凸变英雄X》:有信赖,更热AI
- 全流程AI赋能,重庆首个美的灯塔工厂照亮中国水机前行之路
- 燃梦绿茵,智联未来,大连移动携手华为打造5G-A×AI数字球场
- 白皮书发布会:空调行业新标准 海信AI技术让空调能耗下降41%
- 从防伪溯源到智能协同,动码印章借AI之力重塑酒业生态
- 拒绝机械化互动!云知声兽牙AI Agent功能上新,开启智能协作新时代
- 腾讯云AI存储解决方案持续升级,为AI全业务场景提供全面支持
- 星汉大模型2.0:AI大模型浪潮奔涌 大华股份呈交“智能答卷”
- Flat Ads:透视中国AI出海战略,看豆包、腾讯元宝、美图相机如何占领市场先机
- 动码印章搭载AI引擎,筑牢教育行业数字化转型安全基石
- 2025电动汽车百人会:神州数码AI破局,构建车企AI增长点
- 云轴科技ZStack CTO王为@中国GenAI大会:AI原生实践重构AI Infra新范式
- AI+教育,浩鲸科技参加2025高校人工智能大模型建设发展论坛
- 摩尔线程与松应科技达成战略合作,国产GPU+物理AI仿真打造具身智能开发“新底座”
- 广和通与实丰文化达成战略合作,共建AI产品联合实验室