炬芯科技AI多模态交互芯片智启教育创新高
2020-02-13 18:14:57AI云资讯1200
所谓“模态”,英文是modality,用通俗的话说,就是“感官”,多模态即将多种感官融合。
目前的人机智能交互比如语言控制不如屏幕控制那么精准,很多时候会误判指令和错误唤醒,比较语言充满了不确定性;再比如,语音交互的物联网设备还是缺乏主动服务的能力,只是换了操作方式而已,用户体验没有本质提升。

假如我们把“模态”通俗地理解为感官,那么智能音箱就是只具备听觉模态的物联网设备,而加载AI分析能力的摄像头可以视为视觉模态的物联网设备。把听觉、视觉甚至更多模态组合到一起,多模态物联网也就诞生了。
目前的AI设备中感知模态主要包括三种。第1种是、语音交互,包括语音指令控制、语义理解、多轮对话、NLP、语音精准识别等领域;第2种叫做机器视觉,包括自然物体识别、人脸识别、肢体动作识别等;第3种则是传感器智能,包括AI对热量、红外捕捉信号、空间信号的阅读与理解。

把这三种东西融合在一起,物联网设备就可以在单纯的能听会说之外,同时还用摄像头观察、用传感器判断。而比较前沿的多模态感知还包括机器嗅觉,机器触觉和情绪理解等内容,但目前还没有落地产品。
目前多模态交互的主要应用场景:
场景一:多模态AI交互技术投射在物联网设备上,大概就是用机器视觉技术进行嘴唇识别,来分离语音交互指令。尝试通过用机器视觉来读取说话人的唇语和动作,来判断每个声音指令的来源。
场景二:多模态空调。在一些新的智能空调解决方案中,空调会在语音交互的基础上通过机器视觉来判断用户的位置,提供智能送冷,并且会结合传感器判断屋内温度和湿度,提供更精准的环境方案。
场景三:多模态电视。今年电视背后的AI平台战打得风生水起,把机器视觉技术引入电视成为了新的趋势。通过机器视觉来让电视观察屋内照明情况、用户与电视的距离,电视可以主动调节屏幕光线强度,输出比较护眼的模式。还有的AI应用是让电视在观察到儿童看电视后主动开启童锁。

据媒体报道, 2019年年底国产芯片核心玩家炬芯科技隆重举办了TechLife开发者大会,以“多模态交互技术”为主题,在人工智能的大背景下探讨多模态交互技术的落地和发展,同时还邀请了阿里达摩院、喜马拉雅、玩瞳科技、CEVA 等多位技术大咖,共同探讨行业前沿技术,现场人气爆棚,可见炬芯科技对未来趋势有着独特的预见性,这也是多年来行业领先致胜竞品的重要原因之一。

人机交互正在从键盘鼠标的交互转变成语音视觉等多模态交互。交互门槛的不断降低,给交互体验带来了明显提升。
为实现更优质交互体验,炬芯作为一家芯片设计厂商的也在持续深耕技术,希望用更优质产品给智能机器赋能。炬芯推出 ATS 3607、 ATS 3607D、 ATS 3609、 ATS 3609D 四款多模态智能交互芯片,充足的算力、超低的功耗、强大的可扩展性,将赋予机器更多的可能性。
其中,炬芯 ATS 3609D,多麦智能语音、轻智能图像、双模态识别手指输入解决方案。将语音交互、机器视觉和传感器三个模态综合,为强人工智能下的多模态交互提供可行解决方案。
AI 多模态交互技术已经成为人工智能交互的必然趋势,我们也期待着炬芯多模态交互芯片平台能在更多的场景中应用开来,赋予机器更强的智能属性,用更加像人的智能机器给大家带来更好的服务。
相关文章
- 持续落地!炬芯科技刷新消费级AR、AI眼镜芯标准
- 端侧新品,炬芯科技 ATS288X AI-Party Speaker 芯片重磅发布
- 炬芯科技端侧AI音频芯片ATS323X荣获”2025年度中国IC设计成就奖”
- 炬芯科技再发端侧 AI音频芯片 ATS362X 低功耗大算力引爆音频新浪潮
- 炬芯科技助力VIZIO打造二合一家庭娱乐音频产品
- 喜讯!炬芯科技ATS3031荣获“2024全球电子成就奖之年度创新产品”
- 炬芯科技周正宇:Actions Intelligence 端侧AI音频芯未来
- 炬芯科技联合驊訊电子推出颠覆性Xear™ 7.1.4 全景3D空间音频无线电竞耳机方案,重新定义游戏音效
- 炬芯科技高音质蓝牙音频芯片获LGE XBOOM Go系列无线音箱采用
- 炬芯科技低延迟高音质蓝牙音频芯片荣获“2023-2024年度半导体市场最佳产品”
- 炬芯科技上榜2024 中国IC设计Fabless 100 排行榜之TOP 10无线连接公司
- 炬芯科技智能手表芯片助力荣耀亲选新一代智能手环海外上市
- 炬芯科技布局汽车音频DSP芯片领域
- 炬芯科技周正宇:焕新声音活力,AI驱动下的音频芯片创新
- 炬芯科技助力小米Redmi Watch 3 青春版,打造腕上大屏自在的通话体验
- 炬芯科技助力索尼推出清晰澎湃音质的蓝牙音箱新品
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









