智能IoT设备应用语音技术,需解决三大挑战
2019-07-29 11:24:10爱云资讯554
在近期举办的2019全球人工智能与机器人峰会上,思必驰CTO周伟达介绍了智能耳机、智能音箱等IoT产品应用语音技术的挑战,并给出了相应的解决方法。
挑战一是低功耗。智能音箱一般插电,百毫瓦级别的功耗可以接受,但智能耳机的电池只有70到80毫瓦时,功耗必须做到1毫瓦左右,包括数字麦克风、ADC、功放等,留给语音采集、唤醒、声纹、本地识别的部分非常少,挑战很大。
挑战二是远场和高噪声,IoT智能家居不能用手握着麦克风采集语音,很多环境下人们需要跟设备进行自然地语音交互,这种远场的语音交互一是有较低的信噪比,二是会有周围噪声的干扰。
挑战三是全场景智能交互,IoT设备五花八门,涉及的场景超过100个,语音技术现在还不能绝对做到通用的语音识别,涉及到场景背后的语音模型带来的领域知识,很多需要定制,这是语音技术走向市场化、规模化的挑战。
周伟达指出,对于功耗,行业内的解决方法基本上“算法+硬件”,思必驰则是从算法的需求定义芯片,通过算法逐级计算性能,逐级把极少的场景下启用高功耗,大部分的场景下保持低功耗工作。
对于远场和高噪声,行业内普遍采用麦克风阵列,从环形四麦、环形六麦,双麦阵列、线性四麦,思必驰采用了分布式麦克风阵列,不受间距约束,并针对常见的快递小哥用耳机通话的风噪场景,进行针对性降噪处理。
对于全场景的语音交互,很多家庭已有多台智能IoT设备,唤醒交互已经成为“反人类设计”,需要解决多设备交互、多设备联动,并有很强的语义选择能力、多模态直视唤醒能力。思必驰采用平台化思路,接入开发者,打通智能家居各种互联协议,目前已打通20多个协议。
相关文章
- 五金不再“传统”!BOS Cloud帛丝云商助力拓臣科技开启智能新时代
- 从“怕衰减“到“放心用”:揭秘绿源智能超续航的科技密码
- 2025智能机器人发展大会开幕,微美全息加速领航AI+具身智能新赛道
- 小米AI眼镜携手明月镜片,发布下一个时代的智能设备
- DXOMARK 发布第六版智能手机影像测试基准: 着眼用户真实体验,全面升级评测体系
- 数据为笔绘少年答卷!2025 少年开发者人工智能大赛复评答辩完美收官,决赛蓄势待发
- 亿航智能、ADIO和MLG合作在阿布扎比公开试飞eVTOL,拓展中东低空经济新航道
- 轻帆云ITSM智能知识库,助力企业运营创新与服务价值提升
- 中国移动和华为AI核心网荣获GSMA AMOs“亚洲最佳人工智能创新奖”
- 重磅发布!全应科技 IDIC 数智一体机,让工业迈入AI智能时代!
- 全球首批!安脉盛跻身世界经济论坛人工智能MINDS领袖阵容
- 首批!凯美瑞德入选中国信通院《AI Agent智能体产业图谱1.0》
- 米乔人体工学携手智能系统工效学设计与评价标准工作组,共同制定标准新方向
- 破解“深圳速度”睡眠困境,舒达智眠中国行携AI智能床开启「躺鉴会」
- 华为智选焕新鸿蒙智选,与首批智能终端精品伙伴IAM共赴星辰大海
- 芯驰科技与罗姆罗姆联合开发出车载SoC X9SP参考设计, 配备罗姆面向SoC的PMIC,助力智能座舱普及!
人工智能技术
更多>>人工智能公司
更多>>人工智能硬件
更多>>- 从灵感到成片 三星Galaxy S25 Ultra让影像创作更高效
- 芯原推出经市场验证的ZSP5000视觉核心系列,扩展其面向边缘智能的数字信号处理器IP组合
- 从双城救援到DJI FC100发布:大疆无人机重塑应急救援新方式
- 大朋VR AI眼镜预发布,从 VR 领航者到 AI 穿戴开拓者
- 录音界的“黑科技”!索尼ICD-TX660:专业录音、高效随行
- 重磅!方芯半导体推出国产EtherCAT从站控制芯片,原位替代Microchip LAN9252/9253/9254
- 大疆发布旗舰级运载无人机DJI FC100:80kg载重、9分钟快充,开启无人机运载新时代
- 智能健康领域新突破:Ulook脑机智能眼镜正式上市,重新定义“眼-脑-心理”联动新范式