智能IoT设备应用语音技术,需解决三大挑战
2019-07-29 11:24:10爱云资讯539
在近期举办的2019全球人工智能与机器人峰会上,思必驰CTO周伟达介绍了智能耳机、智能音箱等IoT产品应用语音技术的挑战,并给出了相应的解决方法。
挑战一是低功耗。智能音箱一般插电,百毫瓦级别的功耗可以接受,但智能耳机的电池只有70到80毫瓦时,功耗必须做到1毫瓦左右,包括数字麦克风、ADC、功放等,留给语音采集、唤醒、声纹、本地识别的部分非常少,挑战很大。
挑战二是远场和高噪声,IoT智能家居不能用手握着麦克风采集语音,很多环境下人们需要跟设备进行自然地语音交互,这种远场的语音交互一是有较低的信噪比,二是会有周围噪声的干扰。
挑战三是全场景智能交互,IoT设备五花八门,涉及的场景超过100个,语音技术现在还不能绝对做到通用的语音识别,涉及到场景背后的语音模型带来的领域知识,很多需要定制,这是语音技术走向市场化、规模化的挑战。
周伟达指出,对于功耗,行业内的解决方法基本上“算法+硬件”,思必驰则是从算法的需求定义芯片,通过算法逐级计算性能,逐级把极少的场景下启用高功耗,大部分的场景下保持低功耗工作。
对于远场和高噪声,行业内普遍采用麦克风阵列,从环形四麦、环形六麦,双麦阵列、线性四麦,思必驰采用了分布式麦克风阵列,不受间距约束,并针对常见的快递小哥用耳机通话的风噪场景,进行针对性降噪处理。
对于全场景的语音交互,很多家庭已有多台智能IoT设备,唤醒交互已经成为“反人类设计”,需要解决多设备交互、多设备联动,并有很强的语义选择能力、多模态直视唤醒能力。思必驰采用平台化思路,接入开发者,打通智能家居各种互联协议,目前已打通20多个协议。
相关文章
- 九科信息bit-Agent智能体,打通企业应用DeepSeek等大模型的最后一公里
- Meta AI宣布即将使用欧盟用户数据训练人工智能模型
- 英伟达宣布在台积电亚利桑那州工厂投产Blackwell人工智能芯片
- 驰芯半导体UWB芯片:重构智能汽车安全生态,领航百亿级车载市场
- “科技振城 智能赋宛”盛会落幕,开启南阳智能新篇
- 创维健康智能穿戴闪耀创维2025全品类客户大会,黄宏生盛赞儿童手表“守护未来之星”
- 具身智能初创企业深谋科技携手LG、GS一起打造人型机器人多元产业落地场景
- 再获权威认可!深演智能强势上榜IDC中国AI Agent应用市场全景图报告
- 长安汽车与腾讯合作再深化,共建智能驾驶数据闭环
- 安卓表皇新品:小尺寸智能旗舰OPPO Watch X2 Mini
- 直击2025德国宝马展:机械星球×MechLink超8500KM智能挖掘系统全球首秀
- 阿里巴巴AI智能眼镜年底登场,微美全息以“AI+AR”领航开启人机交互视界新篇
- “基础设施+高阶服务”推动智驾跃迁,华为云智能驾驶用户大会成功举办
- 中移互联:“智能通讯+安全护航”绘就数智未来新蓝图
- 九章云极DataCanvas入选2025全国企业“人工智能+”行动创新案例TOP100
- 云知声受邀参加2025中国数字经济产业发展大会,携手多方共筑苏州人工智能战略生态