智能IoT设备应用语音技术，需解决三大挑战-爱云资讯

在近期举办的2019全球人工智能与机器人峰会上，思必驰CTO周伟达介绍了智能耳机、智能音箱等IoT产品应用语音技术的挑战，并给出了相应的解决方法。

挑战一是低功耗。智能音箱一般插电，百毫瓦级别的功耗可以接受，但智能耳机的电池只有70到80毫瓦时，功耗必须做到1毫瓦左右，包括数字麦克风、ADC、功放等，留给语音采集、唤醒、声纹、本地识别的部分非常少，挑战很大。

挑战二是远场和高噪声，IoT智能家居不能用手握着麦克风采集语音，很多环境下人们需要跟设备进行自然地语音交互，这种远场的语音交互一是有较低的信噪比，二是会有周围噪声的干扰。

挑战三是全场景智能交互，IoT设备五花八门，涉及的场景超过100个，语音技术现在还不能绝对做到通用的语音识别，涉及到场景背后的语音模型带来的领域知识，很多需要定制，这是语音技术走向市场化、规模化的挑战。

周伟达指出，对于功耗，行业内的解决方法基本上“算法+硬件”，思必驰则是从算法的需求定义芯片，通过算法逐级计算性能，逐级把极少的场景下启用高功耗，大部分的场景下保持低功耗工作。

对于远场和高噪声，行业内普遍采用麦克风阵列，从环形四麦、环形六麦，双麦阵列、线性四麦，思必驰采用了分布式麦克风阵列，不受间距约束，并针对常见的快递小哥用耳机通话的风噪场景，进行针对性降噪处理。

对于全场景的语音交互，很多家庭已有多台智能IoT设备，唤醒交互已经成为“反人类设计”，需要解决多设备交互、多设备联动，并有很强的语义选择能力、多模态直视唤醒能力。思必驰采用平台化思路，接入开发者，打通智能家居各种互联协议，目前已打通20多个协议。