科大讯飞钱勇:车载语音交互技术助力智能汽车强势发展

2019-02-21 14:24:14爱云资讯

2月20-21日,2019全球第二届自动驾驶论坛在武汉举办,本次论坛以“智能驾驶 改变未来”为主题。科大讯飞智能汽车事业部副总经理、车载系统产品线总经理钱勇发表了主题演讲,演讲内容如下:


各位来宾,各位朋友,大家下午好。非常高兴今天有机会在这里跟大家一起探讨,一起学习,刚刚坐在下面听了前面几位分享嘉宾的分享内容,感慨很深,我想我们都是在为汽车智能化这个方向,在各个领域里面工作。然后也非常感谢盖世汽车能提供这样的一个平台,让我们这些人能够聚在一起,相互的交流,相互的学习。我今天给大家带来的汇报的主题是人工智能助力汽车的智能化发展。

这几年来看,其实人工智能已经成为一个非常热门的话题。人工智能技术的确能够提升人类工作的效率,也成为各个国家在科技发展领域必争的一块市场,人工智能的技术,这几年取得了突飞猛进的进步,然后在各个领域已经深入的应用了,大家平时能够看到像在语音助理这一块,能够提高人类获取信息的效率。在这个教育领域,人工智能的应用能够使学生享受个性化的服务,使老师的教学更加的高效。然后比如在医疗领域,大家现在看的会比较多的像人工智能,能辅助医疗诊断。人工智能这些技术在各个行业的应用,其实离不开咱们人工智能技术的发展。科大讯飞作为人工智能技术的研究和产业应用的企业,我们一直投入巨大的精力在人工智能技术的研究和应用这一块,2018年我们在整个人工智能技术的核心应用这块取得了巨大的一些进步,我们拿到了12个世界第一,这里面除了我们的语音识别,语音合成这样的技术以外,在机器阅读理解,在语义理解以及在医学影像诊断这一块也取得了非常突获得进步。

科大讯飞作为国家四大人工智能开放平台,目前我们的语音的日活使用次数达到了47亿次,我们的平台支持了将近90万的开发团队,在人工智能的技术上进行的应用产品的开发,大概开发了将近55款产品的应用。这些产品将在未来的一段时间里面走进我们生活的各个方方面面。我们看一下我们在汽车方向的人工智能在汽车方面的应用。科大讯飞在汽车领域已经默默耕耘了大概有16年左右。从2012年开始,我们提出了基于云加端的架构,以及自然语言理解的技术,使汽车上的语音交互更加的自然。然后在2014年我们推出了行业首款卖空阵列的降噪技术,大家都知道在车上有非常大的噪音,语音识别在车里头噪音的技术上如何去噪,然后去提升语音识别的效果,这是2014年我们重点的突破。在2017年我们基于AIUI的技术又推出了全双工的人工交互技术,让人机的交互更加的方便,更加的自然。

所以基于当前我们在汽车的智能语音的应用这一块已经形成了完整的技术闭环,从前端的语音降噪到语音识别,到自然语言理解,再到语音合成,整个闭环的应用能为汽车的语音的应用起到了非常大的基础的推进的作用。整个的语音也得到了行业伙伴的认可与及大家的支持,目前我们的整个的语音在前装上已经达到了1500万的出货。这次非常感谢大家的支持。以上简单的把我们原来的整个的语音交互,在这个行业里面的应用和前景情况跟大家汇报了一下,其实现在大家今天上午大家也都在谈,其实汽车现在处于一个非常重要的智能化升级的时代,在智能化升级的时代里面,多项技术会融合应用来推进整个汽车的智能化升级。所以在这个阶段里面,其实我们大家更应该探讨的是如何融合这些技术来提升汽车的智能化发展的进程。人工智能在汽车方面的应用,其实从我们的角度理解大概可以分为两个方面,第一个方面,汽车对于环境的理解,也是今天很多嘉宾分享的关于自动驾驶这一块的内容,其实我还有一块是汽车对于人的理解。汽车对于人的其实在自动驾驶来临之前,所有的功能的开拓,或者是说自动驾驶的设计,都是为了人的体验服务的。

人机交互和自动驾驶其实是一种耦合平行的发展的过程的,在不同的自动驾驶的阶段,对于人机交互这个方向的需求也是不一样的。基于当前的自动驾驶的发展阶段,其实我们更多看到的像座舱的体验和出行的体验,这个阶段人机交互领域的必然的研究的方向。从整个架构的角度来看,整个汽车的智能化大概可以分为几个域,第一个就是网关域,也就是我们传统的总线级别的,第二个是人机交互域,第三个是驾驶域,三个在各自的领域各自的方向都在进行深度的自主发展。其实这三个本身也要形成这种协同式的发展,来提高真正的智能化的进程。

今天我主要想跟大家分享一下人机交互域的问题,人机交互在前一个阶段家行业里面通力合作情况下,已经取得了比较好的进步,但是仍然会存在一些问题,我们大概总结一下,分为几个方面,第一个方面就是人机交互的方式,现在人机交互的方式虽然已经引入了语音,但是仍然会存在这种机械感比较强的感觉。第二,这种交互的方式比较单一,语音就是语音,图像交互就是视觉交互。第三个就是车内多人交互会相互干扰。第二个板块,其实我们看到内容服务这一块,内容服务的生态的割裂以及APP化对用户的体验非常大,影响非常大。然后还有一点就是汽车场景单独的服务的创新其实是非常难的。一般的团队或者小的团队是很难在这个方向做创新发展的。第三个就是整车,虽然智能化的部件越来越多,但是整体上来看的话,整车的智能化部件还是相对较少,这些部件之间的接口不标准,部件之间的融合智能化的融合,其实难度非常的大。所以基于这样的现状,我们一直在考虑下一代的人机交互域的解决方案是什么样子的,我们提出咱们的系统整体解决方案,解决方案重点我们解决三个问题,第一个是智能交互,交互升级,让我们要塑造一个有温度,有情感的人工智能的助理。第二个就是服务的升级,去APP化实现让服务找人。第三个就是整车融合,让整车上的智能的设备能融合一体,提升整车的智能化的交互体验效果。

首先我们看第一个部分,就是智能交互的发展,汽车上的人机交互方式,从最早的按键式的交互到后面的触摸屏式的交互,再到现在的语音交互,在语音交互里面又分为三个阶段。第一个阶段我们可以看到像命令词的交互,第二个是现在我们在推的自然语言是的交互。到第三个阶段,多轮交互将会成为主流,在智能交互里面,我们重点会推三大升级,这三大特性分别是什么?第一是多模态交互,第二是多乘客交互,第三是情感化交互,多模态交互,大家可以理解,最早的是按键式交互到触屏式交互,以触屏为主的交互,以及我们以推动了语音为主的交互,其实在上个阶段融合花费了很长的时间,再往后面会融入视觉交互和声纹交互,这些感知层面的融合,其实在认知层面需要一个运算大脑的融合,最后在我们的呈现层面,在不同的平台执行机构上进行展现。

第二个是多乘客交互。随着智能驾舱以及智能移动出行的普及和发展,多乘客交互在车上会越来越实现,多乘客在车上能够获取自己个性化的服务,是未来我们看到的一重要市场的趋势方向。大家有看到过未来的车上面已经能够实现不同的驾驶位,通过语音交互能够获取不同的服务,坐在主驾驶的发出指令,帮我打开天窗,打开的一定就是主驾驶位的天窗。所以这里面依赖于我们首发的一款技术,多音区方案是基于科大讯飞最早的麦克风阵列技术,对车上的一位置进行区分,然后结合声纹技术,让每个客户每个乘客能够享受到它个性化的服务。

第三情感化交互。现在很多人托我通过语音交互跟我们的汽车交互。还是有冷冰冰的这种汽车的感觉,所以我们会融合VR技术,为每一个汽车打造每一个汽车用户,打造一个专属自己的虚拟人工助理。第二个板块就是智能服务,智能服务这一块,其实我们面临的要去解决的就是去APP化以及实现服务找人,最早的现在我们的交互方式都是让人去找服务,其实在这个阶段要让服务找人和人找服务,这两种模式都能够融汇在一起。

简单看一下去APP化的体验,核心在于云端的融合,在于账户的打通,在于数据的融合。有一个很简单的场景,比如说我们早上去跑步,我在听一首音乐或者听一个书,当我在上车的时候,我的场景应该自动能够从移动端转移到我的车端,要实现这样的体验,就必须打破原来APP的限制,能够让云端的数据和账户能够融会贯通。目前我们的积极努力,我们跟高德地图,QQ音乐,喜马拉雅,美团,这些大的IP已经能够实现账户的通,然后让大家实现场景的转移,然后实现服务找人。服务找人其实是一个非常苦非常累的活,他的核心的原理是在于基于用户的数据支数据的分析的基础上,把用户的在汽车领域的使用场景进行细分。细分到你在每一个细分场景下,你可能出去线的这样的诉求,然后让服务主动通过主动交互的方式,让服务触达的我们的用户,这个是需要慢慢去细分场景的,然后最核心的一个是我们叫智能场景的模型。

从理念上讲,我们拒绝生态割裂。所以我们一直在探索生态融合的这种方式,我们非常努力的和互联网的生态内容和服务商进行合作。目前我们已经与这里面所有的生态合作伙伴进行了融合的贯通,我们的理念是为用户提供最好的服务,非生态的。基于现在我们的合作模式,我们已经形成了大概七大类30小项的专业技能,只有这种技能的研发,才能够让我们在车上使用这些服务更加的方便,更加的便利,因为汽车场景不是简单的把手机上的APP搬过去就可以了,这还解决不了一个问题,只靠几个有限的人去做这样的事,发展会非常的慢,所以把现在前面做的这些工作的经验,做成了一个开放这样的平台,让更多的我们的开发者能够能够以更简单更方便的模式参与到技能的开发里面来,而且能够提供一套快速上线平台,能够让这些技能和服务能上线,让我们的主机厂也能够积极的参与到自己的产品的改进系统里面来。

在期间的智能融合这一块,现在大家可能看到的最多的。比如说我们叫控制车窗,控制空调,控制座椅。随着汽车上的智能部件的越来越多,我们会面临更多的像我们看到的智能的行车记录仪,还有数资的仪表以及氛围灯,只有这些设备的贯通融合,才能够把整个汽车的智能的场景真正的提供我们的用户。随着刚刚咱们说的智能驾驶的发展,以及智慧交通的发展,我们会开放一系列的接口与咱们外围实现跨越的融合,自动驾驶和人机交互域的融合。现在目前我们能支持的像360的环视,人脸识别和疲劳检测这些的系统之间的对接的工作。

以上我们介绍了基于下一代的人机交互域的解决方案,它的主要的核心特点就是我们刚说的三个交互的智能,服务的智能和整车的融合。这样的一套系统,其实它是需要与行业里面的各类的合作伙伴进行深度合作的,只有把这些服务,互联网的服务和整车的部件的智能融合在一起,才能够真正的打造汽车的智能化的一个体的。在整个汽车智能化时代的发展里面,其实我们面临的巨大的挑战,也给我们提出了更高的要求。在这样的一个时代里面,我们只有相互的配销户的跨界的融合,相互的合作才能够更快地推动汽车智能化的发展,能够为我们的用户的每一次出行更加提供更高效的这种体验的服务。
相关文章
热门文章
头条文章
重点文章
推荐文章
热点文章
关于我们|联系我们|免责声明|会展频道
冀ICP备2022007386号-1 冀公网安备 13108202000871号 爱云资讯 Copyright©2018-2023