智能IoT设备应用语音技术,需解决三大挑战
2019-07-29 11:24:10AI云资讯568
在近期举办的2019全球人工智能与机器人峰会上,思必驰CTO周伟达介绍了智能耳机、智能音箱等IoT产品应用语音技术的挑战,并给出了相应的解决方法。
挑战一是低功耗。智能音箱一般插电,百毫瓦级别的功耗可以接受,但智能耳机的电池只有70到80毫瓦时,功耗必须做到1毫瓦左右,包括数字麦克风、ADC、功放等,留给语音采集、唤醒、声纹、本地识别的部分非常少,挑战很大。
挑战二是远场和高噪声,IoT智能家居不能用手握着麦克风采集语音,很多环境下人们需要跟设备进行自然地语音交互,这种远场的语音交互一是有较低的信噪比,二是会有周围噪声的干扰。
挑战三是全场景智能交互,IoT设备五花八门,涉及的场景超过100个,语音技术现在还不能绝对做到通用的语音识别,涉及到场景背后的语音模型带来的领域知识,很多需要定制,这是语音技术走向市场化、规模化的挑战。
周伟达指出,对于功耗,行业内的解决方法基本上“算法+硬件”,思必驰则是从算法的需求定义芯片,通过算法逐级计算性能,逐级把极少的场景下启用高功耗,大部分的场景下保持低功耗工作。
对于远场和高噪声,行业内普遍采用麦克风阵列,从环形四麦、环形六麦,双麦阵列、线性四麦,思必驰采用了分布式麦克风阵列,不受间距约束,并针对常见的快递小哥用耳机通话的风噪场景,进行针对性降噪处理。
对于全场景的语音交互,很多家庭已有多台智能IoT设备,唤醒交互已经成为“反人类设计”,需要解决多设备交互、多设备联动,并有很强的语义选择能力、多模态直视唤醒能力。思必驰采用平台化思路,接入开发者,打通智能家居各种互联协议,目前已打通20多个协议。
相关文章
- 七夕为爱升级!Partyhouse派对屋智能影K,声临其境的私密浪漫宇宙
- 第六届智服未来大会即将启幕:以AI驱动服务破界,共探智能商业时代增长涌现新范式
- CoinW 全链协同 ,智能引擎,重塑数字资产交易新范式
- 捷达VS8全面预售,芯驰X9助力打造高效实用的智能座舱
- AI 赋能财税新生态,慧算账书写行业智能升级新篇章
- 限时免费 | 汽车行业白皮书升级:解锁AI世界风险地图,智能防范“断链危机”!
- 新品上线 | 空有线索名单?AI触达合作优选精准联系方式,智能推荐触达路径!
- 新品上线 | AI商机匹配首发!大模型智能提纯10%高价值营销机会,引爆转化!
- 达实智能2025半年报:AI应用收入首次破千万,商业化拐点或已至
- HTC加入AI智能眼镜的行列 新款Vive Eagle智能眼镜内置AI助手
- 一步到位的智能体验 三星Galaxy手机用AI构建高效新日常
- 好易点智能晾衣架好用吗?精选三款高性价比电动晾衣机推荐
- 破防了!NEPCON ASIA 2025亚洲电子展聚焦具身智能机器人、柔性生产、人工智能、半导体、低空飞行等井喷市场,一展打尽电子黑科技
- 京西智行研发天团访谈:全球悬架电子与软件工程总工解析MagneRide®磁流变悬架智能化应用
- WRC 2025揭示行业趋势:灵巧手正从单一执行器向智能终端演进
- 中能拾贝助力某水电龙头企业,打造“工业大脑”,实现智能领跑