智能语音只是开始,炬芯推多模态芯片探索未来交互
2020-03-02 15:49:55AI云资讯1369
随着设备创新和人工智能、大数据等前沿技术的发展,人和机器的交互方式正在发生巨大的变革。交互方式正在从单一交互模态演变为多模态自然交互,从人机互动式交互演变为增强智能的隐式交互。未来的交互模式会发生怎样的变革,如何更好地设计未来的智能系统?

趁此科技发展热潮,2020年初CCF TF(技术前线)第19期邀请到了4个IT巨头的技术专家,研讨和畅谈“未来智能设备的交互技术”,为大家分享了不同领域智能交互技术的探索与实践,包括增强现实、智能设备与计算视觉技术,高性能、低功耗、低成本的边缘AI芯片及解决方案,智能对话技术的产业化应用实践,利用语音、视觉乃至无感等自然交互的多模组合打造完整智能生活体验,以及雷达感知的智能交互技术。专家一致认为,未来的智能交互方式将多模态化,智能语音仅仅只是开始。

近几年来,智能对话已经逐步深入到了各行各业,通过车载、音箱、客服、机器人等场景,给用户带来了更加便捷与高效的交互体验,最先落地的是智能语音。随着技术的升级和产品的不断推出改进,智能语音的体验已经在智能音箱、机器人等设备上实现良好体验效果。但是,智能语音交互的体验仅仅只是声音的对话,而并没有图像的互动。通俗的说,未来的智能交互方式,不仅拥有声音的对话,更拥有动作、环境、视觉的交互,让机器变得更人一样,有眼睛和耳朵,以及更重要的拥有深度学习能力的“大脑”。
强人工智能主要是指能够学习知识、思考问题和解决问题的的通用智能,机器具有多通道的知觉并且具有意识,在各方面都能和人类比肩。人工智能如果需要在生活中有更好的体验,我们希望它能像人体一样,能耳目鼻口协同工作,主动提供服务。如何让机器拥有如此强大的深度学习能力,让它听明白和看明白人类的动作和需求,拥有一颗强大的硬件主控芯片至关重要。

随着国家对高新产业的大力支持,人工智能技术已经步入了发展的快车道,高性能的计算芯片甚至 AI 芯片、海量的数据积累和优秀的软件算法都在推动人工智能向更深处不断发展。在智能交互方向上,国产芯片领先代表炬芯科技,在智能语音交互方面已经推出了多款芯片平台,在声音前处理技术方面有着行业领先地位,方案已应用于国内外众多一线品牌,终端产品均稳步量产出货中。面对人工智能的时代跃迁,炬芯正向着更进一步的技术延伸发展。炬芯科技抢先推出旗下首颗多模态交互芯片:炬芯ATS3609D,是拥有多麦智能语音、轻智能图像、手指点读双模态识别输入解决方案。炬芯ATS3609D 将语音交互、机器视觉和传感器三个模态综合起来,为强人工智能下的多模态交互提供可行的解决方案。充足的算力,超低的功耗、强大的可扩展性,将赋予智能机器更多的可能性。

到底,什么样的交互方式才是未来真正的智能生活体验之选?曾有专家这样比喻:“未来的智能化交互体验,将是多方位多模态的,你的任何动作、任何语言、甚至微表情都会被机器的“眼睛”和“耳朵”察觉到,并且第一时间做出相应的动作,达到贴身秘书的服务等级不是没有可能,但需要一颗强大的主控芯片大脑和丰富的云端大数据做支撑。”未来交互之路不远,但仍需稳步前行,每一个智能点的落地都是一场挑战。
相关文章
- 持续落地!炬芯科技刷新消费级AR、AI眼镜芯标准
- 端侧新品,炬芯科技 ATS288X AI-Party Speaker 芯片重磅发布
- 炬芯科技端侧AI音频芯片ATS323X荣获”2025年度中国IC设计成就奖”
- 炬芯科技再发端侧 AI音频芯片 ATS362X 低功耗大算力引爆音频新浪潮
- 炬芯科技助力VIZIO打造二合一家庭娱乐音频产品
- 喜讯!炬芯科技ATS3031荣获“2024全球电子成就奖之年度创新产品”
- 炬芯科技周正宇:Actions Intelligence 端侧AI音频芯未来
- 炬芯科技联合驊訊电子推出颠覆性Xear™ 7.1.4 全景3D空间音频无线电竞耳机方案,重新定义游戏音效
- 炬芯科技高音质蓝牙音频芯片获LGE XBOOM Go系列无线音箱采用
- 炬芯科技低延迟高音质蓝牙音频芯片荣获“2023-2024年度半导体市场最佳产品”
- 炬芯科技上榜2024 中国IC设计Fabless 100 排行榜之TOP 10无线连接公司
- 炬芯科技智能手表芯片助力荣耀亲选新一代智能手环海外上市
- 炬芯科技布局汽车音频DSP芯片领域
- 炬芯科技周正宇:焕新声音活力,AI驱动下的音频芯片创新
- 炬芯科技助力小米Redmi Watch 3 青春版,打造腕上大屏自在的通话体验
- 炬芯科技助力索尼推出清晰澎湃音质的蓝牙音箱新品
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力









