腾讯智能机器人妲己上线 声智携新技术与你相约星际
2019-05-24 18:30:23AI云资讯1682

本次大会上,腾讯新一代王者荣耀智能机器人——“星空魅影”妲己正式上线开启预售!
这是继王者荣耀智能机器人吕布、孙尚香、刘备之后,全新升级的2.0具象化智能机器人系列首次面市。
“请尽情吩咐妲己,主人”,有趣的灵魂和可爱的模样缺一不可,搭载声智科技远场智能交互系统SoundAI Azero的智能机器人妲己,在延续吕布、孙尚香、刘备多项绝技的基础上,从游戏里天真可爱的 “魅力之狐”,完美变身成为生活中能听会说的实时百科、贴心助理和最佳玩伴,不仅实现了对正版游戏角色形象和声音的高度还原,还可为玩家提供出色的智能交互体验,智趣横生。

声智科技基于远场智能交互系统SoundAIAzero为腾讯智能机器人独家定制了软硬一体化的穿透式远场语音交互解决方案,采用6麦环形麦克风阵列设计,匹配波束形成、噪声抑制、回声消除、混响消除等前端声学技术,支持SSP、SSA、Free-cut、One-shot等功能。通过独家研发的6麦环形麦克风阵列(Microphone Array)和穿透式波达方向估计(Penetrated DOA)技术,以及动态声场的回声消除(Vibrated AEC)等独家定制的AI声学算法,赋能腾讯智能机器人,无惧噪声干扰,随时随地响应用户指令。
6麦环形麦克风阵列,优化拾音效果
腾讯智能机器人特殊的造型结构,以及扬声器、麦克风的声学结构设计,均区别于常规智能语音设备(如智能音箱、机顶盒等),对语音信号的拾取提出了更高难度。为打造更出色的用户体验,扬声器和麦克风均被设置于人偶底部,而不同于常规将麦克风阵列置于顶端、扬声器位于底部的“上听下说”且“听说一体”的圆柱或立方体的中空音腔结构。这种结构设计,会使得麦克风在拾音过程中受到人偶部分的声反射和非线性声反射的干扰,增加了前端降噪和信号处理的难度。
同时,为使得腾讯智能机器人可以360°自由旋转随时定位玩家的声源位置,在底座置入了旋转电机,而且电机距离麦克风较近。当人偶进行大角度旋转时产生的电机噪音,对麦克风阵列的拾音效果也会造成非常大的干扰。

为此,声智科技研发了6麦环形麦克风阵列设计,通过算法优化进一步增强了对声音信号的拾取和处理能力,有效抑制自噪声和环境噪声,实现在真实应用场景中3-5米的无障碍智能交互,360度全方位均可以做到随时唤醒、随时打断。
穿透式波达方向估计,提高声源定位准确性
腾讯智能机器人的人偶身体处于麦克风阵列正上方,成为语音信号拾取时的直接障碍物。不规则外形的人偶会造成大量的声反射和声衍射信号,导致多径传播情况的普遍出现,极大地影响了腾讯智能机器人的声源定位功能。

为此,声智科技研发了穿透式波达方向估计(Penetrated DOA)技术,通过优化升级算法,实现即便在噪声干扰大、强混响、多反射的条件下,也可以实现360度的全方位测向,将定位误差控制在10度以内,随时随地响应“主人”召唤。
动态声场回声消除,打造无障碍唤醒
相较于常规智能音箱而言,腾讯智能机器人将麦克风和扬声器同时设置在人偶底座,内部声学构造上麦克风阵列与大音量扬声器相距很近,提高了人机交互过程中的噪声抑制、回声消除的难度。同时,为更好实现立体声效果,妲己采用了高灵敏度全频扬声器,用澎湃低音、柔润高音震撼用户的每一根神经。当发声器件与麦克风的距离位置很近时,对麦克风的声源测向会产生极强干扰,从而影响到人偶在声源定位时旋转角度的精确性。

为此,声智科技研发了动态声场回声消除(VibratedAEC)技术,搭配混响消除、宽场景高灵敏语音唤醒等专属声学AI算法,在保护主方向语音不失真的前提下,去除环境中的非稳态噪声以及空调等其他平稳噪声干扰,自适应抑制混响问题。同时,这一技术还可以去除由于房间混响造成的语音拖尾,提高语音清晰度,解决弱参考信号或无参考信号等复杂场景中的回声抵消问题,在双工语音交互(Double Talk)的情况下仍然鲁棒。从而,有效提升了音乐状态或语音合成(TTS)状态下的唤醒率,以及在5米内的噪音环境下的远场语音唤醒和识别率。
声智科技自2017年成为腾讯人工智能生态合作伙伴以来,依托自主研发的远场语音交互技术,先后为腾讯打造了腾讯智能音箱、智能车机系统以及智能机器人吕布、孙尚香等产品,助力腾讯深化在家居、车载和机器人三大领域的人工智能布局与落地。
文创与科技的魅力交相辉映,IP+AI的实力相得益彰,声智科技依托自主研发的远场智能交互系统SoundAIAzero,可为客户个性化智能机器人整机解决方案,让更多深受大众喜爱的IP形象进入日常生活。同时,声智科技智能机器人整机解决方案除了家居场景以外,还可以落地到智慧出行、智慧酒店等多个场景中,为用户提供更多增值服务和体验。
随着智能语音交互落地场景的丰富,越来越多的用户开始享受智能产品带来的新体验,语音交互技术的潜能和应用价值也将进一步释放出来。声智科技将继续专注于声学语音技术和场景语义技术的应用落地,携手生态合作伙伴,加速产业链的智能化升级,打造更自由的人机互联世界。
相关文章
- 腾讯首发效率智能体工具集,打造“AI提效新标配”
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- 腾讯云ADP4.0发布:推出Claw模式,助力企业Agent规模化落地
- 腾讯董志强:AI Agent已成为众多企业“数字员工”,安全防护需要同步跟上
- Agent进入“生产级”时代!腾讯云ADP4.0发布,打造企业级 AgentOps平台
- 腾讯文档「人机双写」行业首发,原生接入WorkBuddy打造新一代AI办公工作台
- 未来智能与腾讯云达成战略合作,共筑AI Agent硬件与办公智能体新生态
- 腾讯QQ发布“新芽守护行动”,全面升级未成年人保护体系
- 腾讯云MongoDB获亚太游戏行业“三料第一”
- iCourt第二届全国法律人AI大赛走进腾讯,探见法律AI生态新未来
- 首汽约车与腾讯地图达成品牌战略合作 北京发车仪式圆满举行
- 双展联动!携手宝安区、腾讯云,洲明文博会硬核科技清单请查收!
- 腾讯云联合TC601提出国产 Data+AI平台五步转型路径
- 北京无限迭代与腾讯云和中国电信等公司共同荣获全球AI生态基石大奖
- 金山文档Skill、专家与连接器上架腾讯云WorkBuddy
- 腾讯云TVP走进银河通用×NVIDIA×福田戴姆勒,解码AI驱动产业硬核突围之路
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力









