智能IoT设备应用语音技术,需解决三大挑战
2019-07-29 11:24:10AI云资讯610
在近期举办的2019全球人工智能与机器人峰会上,思必驰CTO周伟达介绍了智能耳机、智能音箱等IoT产品应用语音技术的挑战,并给出了相应的解决方法。
挑战一是低功耗。智能音箱一般插电,百毫瓦级别的功耗可以接受,但智能耳机的电池只有70到80毫瓦时,功耗必须做到1毫瓦左右,包括数字麦克风、ADC、功放等,留给语音采集、唤醒、声纹、本地识别的部分非常少,挑战很大。
挑战二是远场和高噪声,IoT智能家居不能用手握着麦克风采集语音,很多环境下人们需要跟设备进行自然地语音交互,这种远场的语音交互一是有较低的信噪比,二是会有周围噪声的干扰。
挑战三是全场景智能交互,IoT设备五花八门,涉及的场景超过100个,语音技术现在还不能绝对做到通用的语音识别,涉及到场景背后的语音模型带来的领域知识,很多需要定制,这是语音技术走向市场化、规模化的挑战。
周伟达指出,对于功耗,行业内的解决方法基本上“算法+硬件”,思必驰则是从算法的需求定义芯片,通过算法逐级计算性能,逐级把极少的场景下启用高功耗,大部分的场景下保持低功耗工作。
对于远场和高噪声,行业内普遍采用麦克风阵列,从环形四麦、环形六麦,双麦阵列、线性四麦,思必驰采用了分布式麦克风阵列,不受间距约束,并针对常见的快递小哥用耳机通话的风噪场景,进行针对性降噪处理。
对于全场景的语音交互,很多家庭已有多台智能IoT设备,唤醒交互已经成为“反人类设计”,需要解决多设备交互、多设备联动,并有很强的语义选择能力、多模态直视唤醒能力。思必驰采用平台化思路,接入开发者,打通智能家居各种互联协议,目前已打通20多个协议。
相关文章
- 绿博会首日,中软高科“护照识读”和“智能体终端”技术获马来西亚领导高度认可
- 第22届天津工博会三大核心子展:自动化・电子・智能检测协同发力赋能京津冀制造高质量升级
- 合合信息入选“科创板价值50强”,多模态文本智能技术助推AI应用升级
- 国内首套丨卓翼智能ZTX260改写超高层消防史,破局超高层建筑灭火全球性难题
- 京东携自营机器人租赁服务亮相2025世界智能制造大会 以普惠模式加速前沿科技落地
- 实力加冕丨卓翼智能荣膺CFIC2025“系留无人机高层灭火领域领军品牌”
- 国内首发!卓翼智能破解超高层灭火世界难题:无人机百米消防实战告捷
- 破局出海:宜选网以移动与智能重塑跨境B2B贸易链路
- 灵生科技与宁波方正联手,产投合作重塑具身智能价值链
- 智能监控,相信安全!威盛电子2025新品发布伙伴大会即将开启
- 破解30万场线下招聘会困局,聘才猫AI赋能智能化升级
- 聘才猫AI背调神器上线!最快3分钟出结果,智能解读报告
- 三星实现技术里程碑:新型NAND闪存功耗降低96%,完美契合智能手机需求
- 先导智能推出固态电池专用叠片机,破解下一代电芯制造工艺难题突破固态电池量产瓶颈!
- 入选“人工智能+行业生态范式产品篇”,科大讯飞助力绵阳游仙区打造县域城市双化协同示范标杆
- 赋能金融数字化!天数智芯助力北京农商银行打造智能影像识别系统新标杆









