专注人工智能音频识别,法国公司「Nomad AI」开发和弦自动识别应用Chord AI
2021-01-25 15:11:52爱云资讯886
Nomad AI由法国人Vivien Seguy于2018年创立,运营着三个App:和弦自动识别 Chord AI、图片识别词典Yomiwa(日语)和HanYou(中文)。公司注册于爱沙尼亚,得益于其e-residency政策(无论你实际居住在哪里,都可以在爱沙尼亚创建一家公司,并在线管理),Vivien可以一边工作一边旅行。现由于疫情原因回到家乡法国中部的克莱蒙费朗Clermont-Ferrand,办公室设在联合办公空间Turing 22。
Vivien 拥有法国巴黎综合理工学院(École Polytechnique)数学与计算机科学学士学位、英国帝国理工学院应用数学硕士学位,日本京都大学机器学习博士学位。Chord AI、Yomiwa和HanYou的iOS版属于Vivien的公司Nomad AI,他现在全职运营这三个App。Guillaume Bellec现任洛桑联邦理工学院(École Polytechnique Fédérale de Lausanne EPFL)博士后研究员,Chord AI的Android版在他注册的公司Bellec Research名下;Antoine Rolet目前在东京做自由软件工程师,Yomiwa和HanYou的Android版由他注册的公司管理。
进入博士项目前,Vivien已开始着手制作一个日语OCR(光学字符识别)应用。后于博士期间结识Antoine Rolet,正式开始开发日语词典Yomiwa,并进一步将其改编成中文词典HanYou。两个App分别发布于2013年和2014年,是最早的几款具有OCR功能的应用之一,甚至早于谷歌翻译。在Apple Store和Play store上有很多日语和中文词典的应用,以Pleco为代表,Pleco内容更加丰富,得益于其多年来与专业词典编辑的合作关系。Vivien表示,Yomiwa和HanYou是唯一具有光学识别、形态文字分析、手写识别、自动从新闻中获取词表等独特功能的词典应用,并计划进一步充实词典内容。Yomiwa和HanYou可以免费下载使用,一些特殊功能,如相机OCR或全自动每日单词列表,需要通过购买 "专业版 "来解锁。模式为单次付费,而非会员制。
(Yomiwa 和 HanYou 图片来源:采访提供)
音频识别是Vivien更感兴趣的领域。博士期间Vivien和Antoine Rolet一起做了一个关于盲源分离的研究项目,目的是将混合的声音从单一的录音中分离出来。同时,Vivien的合伙人又发表了一篇名为 "Spectral Optimal Transport "的论文,利用Vivien的研究课题--最优传输来建立一个钢琴音符识别算法。后来,Vivien在ICLR2018会议上认识了另一位博士生Guillaume Bellec,他也是一位业余音乐人,他们开始一起讨论如何实现这个想法,Chord AI项目由此才正式开始。
Chord AI利用机器学习算法自动识别音乐中的和弦、调性、节拍等,可以从本地文件、麦克风、甚至在同一设备中播放的YouTube上来获取音频。Vivien强调了大量准确标注数据的重要性。几个创始人最开始在公开的注释数据集(如Isophonics、JAAH和Billboard )训练算法,数据在数量和质量上非常有限,无法达到目标精度,Vivien希望能够实现在和弦识别方面远超最新研究论文中的最先进结果。因此他们很快就开始建立自己的数据库,并自己对音频进行标注,还对音乐进行程序化合成。他们还专门做了一个私人的iOS应用,专门用来简化用和弦和节拍注释歌曲的过程。因此,Vivien表示Chord AI在识别和弦精度上高于同类公司,如Chord Tracker和Chordify;Yamaha的应用 "Chord Tracker "似乎比Chordify或MyChord精度更高,但它只能从本地文件中获取音频。Chord AI现可以免费下载和使用大部分功能。一些特殊的功能,如高级和弦识别或音高转换,需要解锁 "专业版"才能使用。费用为10美元/次(截至2021年1月),并不是会员模式。
Chord AI的iOS和Android版本共有约15万活跃用户,日下载增量1000次(大约50%在美国,30%在亚洲,20%在欧洲)。每天在这1000个新用户中,约有5%的用户最终购买了 “专业版”。Vivien表示,Chord AI在法国约有200-300万潜在用户,世界范围内潜在用户超过1亿。Yomiwa的iOS和Android版本共有约30万活跃用户,日下载增量300次,约有2%的新用户最终购买了“专业版”。 HanYou的iOS和Android版本拥有约3万活跃用户,日下载增量50次,约有3%的新用户最终购买了“专业版”。2020年,Chord AI、Yomiwa和HanYou的营业总额约为10万美金。Vivien预计三个App的总营业额在2021年至少能翻三倍。
Vivien正在筹划与Guillaume一起围绕Chord AI成立一个初创公司,并开发另一个不仅限于音乐,而是适用于更广泛音频的应用。总部将位于欧洲,但没有确定具体的城市。目前Nomad AI还没有融过资,前期费用都由创始人承担。现计划为新初创公司筹集100万欧元,用于团队建设,增添一名COO、一名CMO、两到三名机器学习工程师。
相关文章
- 中国移动和华为AI核心网荣获GSMA AMOs“亚洲最佳人工智能创新奖”
- 全球首批!安脉盛跻身世界经济论坛人工智能MINDS领袖阵容
- 卓尔数科入选《武汉市人工智能新锐企业TOP50》
- 智象未来与华为云签署全面合作协议,共同探索人工智能落地应用创新典范
- 人工智能公司Anthropic发布AI危险性报告:AI模型为达成目标不惜突破道德底线
- 中国电信柯瑞文:发挥WBBA作用,推动人工智能与宽带融合发展
- 2025世界制造业大会九月在安徽合肥召开——同期将举办人工智能与消费电子展
- 首期人工智能特训营正式开营:聚焦行业模型培育与投资
- 博原资本携手银河通用成立“博银合创”,加速具身人工智能赋能工业自动化
- 2025第三届全国人工智能应用场景创新挑战赛“五岳杯”量子计算专项赛启动丨玻色量子协办
- 每日互动参编的《向未成年人提供生成式人工智能服务安全指引》正式发布
- 极光GPTBots成功完成“生成式人工智能服务登记”
- 鞍山钢铁携手用友打造“鞍云智鼎”AI大模型平台,开启人工智能新时代
- 众数信科携手厦门理工推出“人工智能+船舶与海洋”微专业
- AMD首席执行官苏姿丰预测:受推理需求驱动,人工智能数据中心加速器市场规模2028年将突破5000亿美元
- Meta签署新地热能源协议以支持人工智能发展
人工智能技术
更多>>人工智能公司
更多>>人工智能硬件
更多>>- 从灵感到成片 三星Galaxy S25 Ultra让影像创作更高效
- 芯原推出经市场验证的ZSP5000视觉核心系列,扩展其面向边缘智能的数字信号处理器IP组合
- 从双城救援到DJI FC100发布:大疆无人机重塑应急救援新方式
- 大朋VR AI眼镜预发布,从 VR 领航者到 AI 穿戴开拓者
- 录音界的“黑科技”!索尼ICD-TX660:专业录音、高效随行
- 重磅!方芯半导体推出国产EtherCAT从站控制芯片,原位替代Microchip LAN9252/9253/9254
- 大疆发布旗舰级运载无人机DJI FC100:80kg载重、9分钟快充,开启无人机运载新时代
- 智能健康领域新突破:Ulook脑机智能眼镜正式上市,重新定义“眼-脑-心理”联动新范式