AI降噪软件出现,手机双麦克风时代或被终结?
2018-12-13 11:17:27AI云资讯873
从诺基亚到iPhone X,手机在这些年产生了天翻地覆的变化。按键消失了、边框消失了、连耳机孔都消失了,屏幕越来越大、摄像头也越来越清晰……
不过人们很难感知到的一点变化是,通话中的噪声变得越来越小了。在机场、火车站一类地方嘈杂的背景音中,清晰地听到彼此的声音并不是一件容易的事,麦克风会把环境音一起收集起来,接听时会受到巨大的干扰。

为了解决这个问题,手机厂商做出了很大努力。目前主流的解决方案是双麦克风,一个放在靠近嘴巴的地方收集人声,一个放在顶端或背部收集环境音,再通过算法将人声从背景音中剥离出来,传送到手机的另一端。
但双麦克风+算法真的是主动降噪最好的选择吗?
两个麦克风,仍然解决不了一个老问题
显然不是这样的。
首先双麦克风降噪本身就有一定的局限性,因为算法要在手机终端运行,所以规模不能太大,实现效果也相对有限。具体表现为,有时用户不再说话时,靠近嘴部的麦克风收集的其实还是环境噪音,对于人声剥离的计算会产生一种断断续续的状况。而且当用户使用蓝牙耳机或有线耳机通话时,手机端的双麦克风降噪算法往往又会失效。
同时双麦克风在工业设计上也会造成很多阻碍。两个麦克风会让声学音频路径的设计更加复杂,在ODM和OEM角度都会增加生产设计成本。尤其在如今手机越来越追求屏占比和轻巧的今天,元件自然是越少越好。
而且在一些使用场合中,用来收集人声的麦克风不一定会被放在人们的嘴边。例如在录音,或者应用一些App上的对讲机功能时,人习惯将手机放置在桌子上,或者拿在举例嘴略远地方。这时两个麦克风很难接收到不同的声音,让算法起不到作用。
如果脑洞开的再大一点,未来我们的手机不一定还是如今的平板形状。也许是能卷起来的曲面屏手机,也许是眼镜形态,未来通话的交互方式,也不一定是将手机的一部分放在嘴边收声。
总之,这种双麦克风降噪模式绝不是主动降噪最终的解决方案。
并不新鲜的DNN降噪,怎样才能落实应用?
其实早在2015年,中国科技大学语音与语言信息处理国家工程实验室就创作了关于通过深度神经网络+单麦克风实现主动降噪的论文。具体实现方式是,建立含有噪声+人声和纯净人声的数据集,以深度神经网络为架构训练出分离噪声和人声的“语音增强回归”算法。
在初步试验后,这种算法的结果还不错。从训练成本来看,即使用人工合成的数据,算法结果仍然表现优秀。也就是说算法的应用者不需要面对到现实世界收集数据,可能会侵犯隐私的难题。从应用上来说,这一算法的降噪能力并不比双麦克模式差,甚至还能克服双麦克风克服不不了的间断噪声问题,有时候人们在走路或跑动时接电话会形成偶尔出现的间断噪声,以往的双麦克风模式很难捕捉到这种噪声,但语音增强回归算法就能将人声从中剥离开来。
不过这种算法在这几年间都没有得到很好的应用,原因很简单,深度神经网络模型往往体量较大,很难实现在终端上运行,如果在云端运行,又难免会因为延迟状况不能在实时通话中应用,要知道人类对于交谈时延迟的忍耐最多只有200毫秒。可要是用在语音的后期处理上,好像也并没有什么意义,只要换个收声好一点的话筒就能解决问题,还能保证音质还原。
不过随着这两年以来终端算力的增长,以及对AI算法的不断优化,在终端部署这类模型已经逐渐成为可能。例如一些蓝牙耳机已经部署上了可以在本地运行的RNNoise算法,通过简单的运算来分离单一收音来源的噪声。
除了手机,AI降噪还有更广阔的舞台
这种本地AI降噪技术的应用舞台,不仅仅在手机一种产品上。除了手机通话之外,我们其实无处不受通话噪音的干扰,尤其当语音交互应用的越来也多时,这些问题也越来越严重。
比如在游戏直播时,主播的声音可能会被外放的游戏声音干扰,必须高价购买专用声卡和麦克风才能和粉丝畅快的沟通。又比如车载场景下的语音交互,又有可能被驾车时嘈杂的背景音和导航的声音干扰,最后逼得一些车联网方案将麦克风阵列装置在了方向盘上。以及这几年很流行的智能音箱,为了防止家庭环境中的噪音干扰,需要在麦克风阵列上增加很多成本,像是苹果的HomePod就足足安装了6个麦克风阵列……

但这一切都在被语音增强回归算法和终端计算所改变。
就像最近,一家名为Krisp的创业企业集合了相关算法推出了一款应用于PC端的软件,利用PC端本地算力来运行模型,降低PC端收音的噪音。不需要昂贵的声卡和外置麦克风,和Skype等等软件也不会产生冲突。同时Krisp还计划推出针对于游戏的定制版本,专门应对游戏语音、游戏直播时被游戏背景音乐困难的问题。
目前这款软件在英伟达的GPU、英特尔的CPU/GNA和ARM的芯片上都能运行,和高通的合作也在洽谈之中。也就是说如今的PC版本只是开始,未来只要能应用这些芯片的终端,都可以应用上Krisp的软件,实现在终端的实时主动噪音抑制。
算法路径逐渐清晰,软件市场会迎来下一个爆发期吗?
因此Krisp也展示出了充分的市场前景,受到了资本的青睐,在首轮融资中就融到了150万美元。Krisp的出现也带出了一个问题:随着终端算力的提升和小规模AI算法的发展,这种软件替代硬件的模式是否会迎来上一个商业上的小爆发?
在终端功能的实现上,永远都有算法和硬件两条路。降噪可以用双麦克风解决,也可以用AI算法解决;拍照效果可以用双摄提升,也可以用单目摄像头+算法来提升;电量不足可以增大电池容量,也可以用资源调度算法解决……
虽然以往我们都是通过硬件上的研发来解决,但这其中也存在不小的问题:硬件的频繁更新会给厂商带来巨大的生产和研发成本,这些成本转嫁到消费者身上时,会导致高端和低端机型在硬件上差距太大,其实还会给开发者带来负担。而且现在硬件追求轻薄小巧,更加大了硬件创新的难度。
但今天我们有了用算法解决问题的条件,事情就会产生很多变化。
首先很多原本在贵价产品上才有的功能,会出现“平价替代”方案。例如此前iPhone X用3D结构光实现的Animoji,如今在快手一类的产品上也可以用AI算法实现类似功能。
同时算法的更新迭代比硬件更加敏捷高效,用户体验可以得到极大的提升。一些创新功能可以更快速的来到用户面前并得到反馈。
最后,终端产品在研发成本和产品形态上都有了更广阔的想象空间。尤其是未来5G应用后,算法模型也许也不再需要拘泥于终端算力,或许会彻底改变我们使用终端产品的方式。
如此看来,或许几年之后软件市场会迎来自移动应用之后的又一次发展机会,起跑线已经划好,就待哨声吹响了。
相关文章
- 天翼云息壤2500万Tokens免费送,打通国产AI落地“最后一公里”
- “码”上有礼!仅需1元!跟随联通元景即刻解锁GLM-5,畅享AI编程新体验
- IBM推出AI智能体驱动的FlashSystem全闪存产品组合,开启“自主存储”新时代
- 查体智能辅助诊疗系统PC版正式发布暨AI中医应用示范医院挂牌
- AI问答正在取代搜索,品牌曝光逻辑彻底变了,软文街GEO帮你抢占新入口
- 爆火Elys + 声网对话式AI引擎,把社交交给AI赛博分身
- 陪伴机器人塞满马年购物车,涂鸦智能打造“AI新年货”
- 艾利特机器人发布“Elite PAI”具身智能大模型,定义工业场景的“有效智能”
- 思博伦通信推出首款面向网络测试与保障的Agentic AI解决方案
- AI中医可视化,把脉是否雷同心电图,看舌头可否归为影像学
- 中昊芯英“刹那®”TPU AI芯片Day0适配智谱GLM-5
- 五载同行!LED+AI+XR,揭秘2026春晚视觉幕后的“洲明力量”
- 500万用户追捧!百度地图岳云鹏文心AI副驾对话破亿,春节互动数据亮眼
- 安徽电信携手华为打造5G-A x AI大上行样板,助力合肥骆岗公园大型无人机灯光秀精彩呈现
- 白龙马变身文心AI副驾?岳云鹏携手百度地图上天津春晚,送出2亿红包!
- 山东移动携手中兴通讯:AI主动治盲,打造地下停车场感知标杆
人工智能企业
更多>>人工智能硬件
更多>>- 忆联UH812a以极致存力破局大模型载入瓶颈,释放算力潜能
- 讯飞翻译机登陆MWC 2026,同传级沟通体验,多语种交流无压力
- 普恩志引领:2026半导体与高端制造前瞻——核心备件如何驱动产业革新与市场机遇
- 超旗舰降噪,殿堂级音质 索尼双芯超旗舰真无线降噪耳机WF-1000XM6正式发售
- 当AI学会“隐身”,手机才真正智能:三星Galaxy S26系列开启AI哲学的降维打击
- 全球首秀!讯飞AI眼镜亮相MWC,多模态同传大模型与极致轻量化设计 引领智能穿戴新风向
- 全球瞩目!荣耀携Robot Phone、Magic V6系列、荣耀MagicBook Pro 14 2026震撼亮相MWC 2026
- MWC直击:荣耀双旗舰搭载第五代骁龙8至尊版,助力智能手机下一代技术演进
人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









