智能IoT设备应用语音技术,需解决三大挑战
2019-07-29 11:24:10AI云资讯583
在近期举办的2019全球人工智能与机器人峰会上,思必驰CTO周伟达介绍了智能耳机、智能音箱等IoT产品应用语音技术的挑战,并给出了相应的解决方法。
挑战一是低功耗。智能音箱一般插电,百毫瓦级别的功耗可以接受,但智能耳机的电池只有70到80毫瓦时,功耗必须做到1毫瓦左右,包括数字麦克风、ADC、功放等,留给语音采集、唤醒、声纹、本地识别的部分非常少,挑战很大。
挑战二是远场和高噪声,IoT智能家居不能用手握着麦克风采集语音,很多环境下人们需要跟设备进行自然地语音交互,这种远场的语音交互一是有较低的信噪比,二是会有周围噪声的干扰。
挑战三是全场景智能交互,IoT设备五花八门,涉及的场景超过100个,语音技术现在还不能绝对做到通用的语音识别,涉及到场景背后的语音模型带来的领域知识,很多需要定制,这是语音技术走向市场化、规模化的挑战。
周伟达指出,对于功耗,行业内的解决方法基本上“算法+硬件”,思必驰则是从算法的需求定义芯片,通过算法逐级计算性能,逐级把极少的场景下启用高功耗,大部分的场景下保持低功耗工作。
对于远场和高噪声,行业内普遍采用麦克风阵列,从环形四麦、环形六麦,双麦阵列、线性四麦,思必驰采用了分布式麦克风阵列,不受间距约束,并针对常见的快递小哥用耳机通话的风噪场景,进行针对性降噪处理。
对于全场景的语音交互,很多家庭已有多台智能IoT设备,唤醒交互已经成为“反人类设计”,需要解决多设备交互、多设备联动,并有很强的语义选择能力、多模态直视唤醒能力。思必驰采用平台化思路,接入开发者,打通智能家居各种互联协议,目前已打通20多个协议。
相关文章
- 明途首届1010数字人节完美收官!WorkBrain V5.5引领智能体生态启航
- 腾讯云TVP走进美的,共探智能制造新范式
- 智能汽车竞争步入深水区,鸿蒙智行:用户体验成为价值新锚点
- 构建B2B平台移动新生态:宜选网如何成为全球贸易智能化的新引擎?
- 智能体×全球化双引擎,华胜天成智能联络中心解决方案亮相全球数字贸易博览会
- 小电智能寄存服务落地杭州西湖,覆盖西湖环线核心景点,小电科技重构旅游服务场景
- 软银豪掷54亿美元投资人工智能机器人
- 更个性、更智能 详解三星Galaxy S25系列Samsung One UI 8更新
- 九识智能联合尚元智行发布“九识尚元”品牌,T1无人巡检车全球首发亮相
- 纵横 G700:40 万享百万级智能,豪华越野智享新旗舰
- 权威认证加持!凯迪仕联合德国莱茵TÜV,定义智能锁品质新高度
- 特赞科技携“创意可计算性:设计人工智能”展区亮相2025 世界设计之都大会
- 京东智能手表白皮书发布:近6成用户将智能手表纳入日常穿搭,表盘尺寸与材质最受关注
- 智能汽车+机器人双线布局,黑芝麻智能锚定端侧AI芯片创新
- 共绘工业智能新未来:英特尔全栈AI与生态成果闪耀第二十五届工博会
- AI定义汽车时代,地平线软硬协同打造智能汽车技术基座