从蓝牙语音到大屏交互,剖析百度在对话式 AI 上的创新

2019-04-24 09:40:08爱云资讯

蓝牙设备可以像 WiFi 设备一样具备语音交互的能力,这是非常有意义的事情。

2017 年,伴随人工智能音箱行业的火热,基于 AI 的语音交互也正逐渐改变人机交互的方式。同时,集语音技术以及内容、服务生态的语音平台应运而生,这些语音平台大多背靠互联网巨头、AI 公司,试图发展成为「AI 时代的安卓」。

对于这些的公司而言,除了 AI 技术和内容闭环服务打通,他们更注重将技术、应用落地到产品,带给用户价值,这样才能反过来促进技术的进步,繁荣生态。

作为国内最繁荣的语音 AI 生态,百度 DuerOS 在产品落地方面有不少领先的成果。在最近由深圳湾主办的「ON THE GO:随行 AI 场景的产品创新」峰会上,来自百度智能生活事业群组的刘悦发表了主题为《百度在对话式人工智能上的创新探索》。

以下为演讲实录,内容经深圳湾整理和编辑。

人机交互发展:从人理解机器到机器理解人

每一次人机交互的迭代都在推动着时代和产品的发展。

我们简单回顾一下人机交互发展经历的三个阶段:第一阶段的 PC 时代,以鼠标和键盘的交互方式促进了 PC 设备发展,相关软件也应运而生。第二阶段的触屏时代,从过去的鼠标、键盘到触控手机,使得硬件的使用成本极大的降低。第三阶段,也就是目前,语音对话的人机交互方式的发展,使得我们理解机器成本进一步降低。

从人理解机器到机器理解人的交互方式的改变,催生了智能音箱、智能大屏设备、智能可穿戴设备、智能车载等设备的发展。

基于语音对话的人工智能产业已经全面爆发

从国外的市场来看,亚马逊 、Google、苹果、微软以及许多创业型的公司加入到这场智能化的变革当中,他们的竞争已经进入白热化阶段,并推动整个市场和产业的发展。

回过头来看,国内的市场情况也跟国外非常像。我们预测,2020 年,对话式人工智能在各个场景上的渗透将大幅度增加:智能家居(上升 27%)、智能车载(上升 51%)、智能可穿戴(上升 68%)。

中国市场的潜力非常巨大,我们发现,目前有非常多的音箱、大屏设备、穿戴设备、耳机等设备都在变成一个可人机自然对话的智能设备,基于语音对话的人工智能产业已经全面爆发。

小度自诞生以来取得的成绩

百度在 2015 年的时候发布了第一款

小度产品

,从那时候我们开始尝试和探索如何做一款这样的产品。至今,小度助手已经成为中国市场最繁荣的语音 AI 生态。

在 2016、2017 年,我们更多的持「生态赋能」的思路,不断跟业界的其他硬件公司合作,包括音箱企业、电视企业(TCL、创维等)、汽车企业、手表企业、耳机企业、手机企业等。我们把 AI 能力赋予不同场景下不同的硬件,让这些硬件成为可语音交互的设备。

2018 年,我们统计了搭载小度助手设备的激活数:从年初的 5000 万涨到 2018 年年底的 2 亿,至今这个数字还在不断提升。当然,激活数据并不能代表这个生态已经达到繁荣,只能从一个侧面反映了搭载的能力。而这样的能力是否真正被用户使用,以及用户是否接受我们给他的新交互方式?

实际上,我们也会非常兴奋地看到,从语音交互次数来看,用户的接受程度也在不断提升。从 2018 年 3 月到 2018 年年底,我们通过月语音交互次数的指标来反映用户交互频率,从最开始的 2 亿次到达去年年底的 16 亿次,这个数字至今还在持续上升,并且速度非常迅速。

从这两方面看来,小度已经变成了中国最繁荣的对话式人工智能平台。

这里面有另外两个指标,我也想分享给大家,一个是语音技能数量,目前小度已经有上千个各式各样的语音技能,我们自己只能做一些头部的技能,更多长尾的技能需要开发者不断提供,这些技能绝大部分都来自于我们社区当中对这方面感兴趣的开发者,使得生态变得更加健康和更加活跃。

另外,根据 Strategy Analytics 的统计,2018 年第四季度,小度系列智能设备的出货量提升到中国第二,增长率达到了全球第一,增势非常迅猛。从现在来看,小度逐渐进入千家万户,成为用户贴心可靠的助手,这也是百度在做对话式人工智能方面的理念和终极目标。

小度的产品发展经历

我们经历了从开始发布产品,到后面不断给第三方赋能,一直到后面自研硬件,一路走下来的过程。

百度对话式人工智能的创新一:蓝牙语音解决方案

接下来讲一讲百度在对话式人工智能所做的创新。除了大家熟悉的无屏音箱、带屏智能音箱,我们还在其他方向做了探索,今天借这个机会给大家来简单分享。

第一个是蓝牙设备。面对各种各样的蓝牙设备(蓝牙耳机和手环等),我们萌生出了给这些蓝牙设备赋能的想法——使得蓝牙设备可以像 WiFi 设备一样具备语音交互的能力,这是非常有意义的事情。

我们首先来看一下蓝牙设备的趋势:根据 SIG 的调查,截止到 2022 年,整个蓝牙设备全球铺货量达到 8.8 亿台。这意味着有很多蓝牙设备等待着我们去升级,对话式 AI 技术将对传统的蓝牙市场带来新的机遇。

从场景上来看,蓝牙设备也存在许多痛点。我们主要总结了三个场景,一个是家中,一个是路上,一个是在车内。在家中,智能音箱既支持 WiFi 又支持蓝牙,可进行语音交互。在路上有穿戴设备和智能耳机,苹果前不久发布第二代 AirPods 支持了 Siri 语音唤醒。第三个场景是车内,人在开车的时候双手被限制在方向盘上,这时候语音交互就会变成非常自然的交互方式。

基于这三个场景,我们怎么帮助用户提升他的体验,怎么帮助设备商更好地提升产品呢?这就是我们之前半年到一年时间探索当中希望解决的问题。

小度蓝牙解决方案

在 2018 年 7 月的百度开发者大会上,百度在国内率先提出了蓝牙设备的语音解决方案——DMA 蓝牙解决方案。在 11 月的百度世界大会上,我们发布了第一款基于 DMA 蓝牙协议的车载支架,这也是我们在车载场景上基于蓝牙解决方案做的实践产品。这个产品并不希望搅乱市场,我们更多是想告诉其他相关的厂商,这样的一个方案是 work 的、是被用户买账的。

同时,因为精力有限,我们也不希望完全自己来做所有语音蓝牙设备,而是希望把蓝牙合作方案输出给更多合作伙伴,让大家打造出具备智能对话能力的蓝牙设备。

而做这件事情的时候,会给厂商带来一系列的问题,比如:

用户是否有需求?对这样的产品感兴趣吗?

是否会增加很大的生产成本?

AI 技术接入门槛高吗?是否需要投入很多人力和周期?

有成型的方案帮助我们落地吗?

语音能力、NLP 打包在方案中吗?

可以给用户提供哪些内容资源?是否收费?

实际中,我们对这些问题也进行了研究和探讨:

小度的装机量、活跃度,以及小度车载支架的热卖,从市场角度印证了,用户对这个产品有非常大的刚需。

产品的功能方面,我们在小度蓝牙方案上基于不同的场景做深度的打磨,比如车载支架相应的车载场景,刚需的内容就包括娱乐、导航、接打电话,针对这些场景深度打磨的产品都会在小度 APP 上得以体现。

针对技术门槛,我们也做了很多优化,提供 SDK 的开发套件,把研发的门槛降到非常低。

DMA 整套方案是免费的一体化解决方案,包括语音技术、背后的内容资源和开放生态,以及第三方技能。

关于小度蓝牙的解决方案

接下来是具体的方案介绍,小度蓝牙的解决方案主要包含两部分,一个是小度 APP,第二个是 DMA 协议。DMA 协议的主要作用是帮助蓝牙硬件和手机上的 APP 之间进行对话式交互通讯。

通过我们提供的 DMA SDK,可以快速把 AI 移植到蓝牙设备,让数以千万的蓝牙设备瞬间变成可以对话的人工智能设备。

当这些蓝牙设备有了语音交互的能力,就能够让用户通过语音交互获取小度云端的内容,包括听音乐、有声节目、导航、控制家居等等。

小度的 DMA 语音解决方案有效解决了经典蓝牙协议的以下痛点:触碰和按键触发、语音输入延时明显、APP 之间的串扰和抢占等。

DMA 解决方案的语音交互不需要触发按钮,并针对远场的语音交互做了非常多的优化,在车内复杂的环境下,唤醒率达到了 97% 以上;DMA 解决方案的 BLE/RFCOMM 通道和 A2DP 可以同时使用,延时从 500ms-2000ms 下降到 200ms-300ms,不影响占用录音通道的 App。

百度对话式人工智能的创新二:大屏交互

今天还会跟大家分享我们另外一个在做的创新探索,即大屏体验。

「让用户放下遥控器」是我们做大屏探索时给自己设定的一个目标。针对找不到遥控器、找片很费劲、音质不理想的几大痛点,我们做了小度电视伴侣这样一个设备,它有很好的 Hi-Fi 音质,全语音远场交互,和全天候人工智能助手,这个产品最终的销量也远高于我们的预期。

在小度电视伴侣,我们专门设计的小度智能电视 UI 可以告诉用户,放下遥控器、试着通过语音来跟这个设备进行交互;

我们还创造了「大屏信息流」的概念,把好的内容通过信息流呈现,并通过语音交互做定制化的推送;

同时,这一设备的整套系统全面接入了小度语音助手,使得语音无处不在,它开机时就是智能电视,关上之后就变成智能音箱,语音交互一直在线……

针对电视上 APP 应用安装麻烦的痛点,小度电视伴侣搭载了 DuerOS 的语音技能,不需要安装,只需一句话就可以调用。

我们希望在后续中不断探索人机交互,以及人工智能如何赋能不同场景的智能硬件,希望对话式硬件被更多人使用。

相关文章
热门文章
头条文章
重点文章
推荐文章
热点文章
关于我们|联系我们|免责声明|会展频道
冀ICP备2022007386号-1 冀公网安备 13108202000871号 爱云资讯 Copyright©2018-2023