AI先行者大会丨思必驰：通向语音落地的“最后一公里”-AI云资讯

语言，是人类传递信息、交流沟通的最为自然的方式。近几年来，人工智能技术迎来第三次发展浪潮，众多智能语音企业纷纷对外宣称其语音识别率已达到97%。然而，在实际应用中，用户却并不买账。

造成这一现状的原因是什么？国内领先的对话式人工智能公司思必驰，又是如何在技术应用落地中破解这一难题的呢？

本月1日、17日，思必驰高级技术总监、语音应用技术负责人薛少飞，先后出席2020AI先行者大会、首届智能家电语音识别与交互技术高峰论坛，进行了现场分享。

2020 AI先行者大会

“尽管语音识别技术有了极大的发展，但当前，它还没有达到一套技术能够打遍天下的状态，在很多真实应用场景中，仍然有‘最后一公里’的问题需要去解决。”薛少飞在分享演讲中表示，语音识别在多数应用中还是一个强场景化的技术。比如说话人的方言、口音和特定场景的噪声，很可能会造成通用系统识别准确率的急剧下降。

同时，由于识别内容的领域不同，所需要去识别的话术也不一样。例如，在聊到语音识别技术的时候提到远场，可能就是远场识别的远；而在日常生活当中说到原厂，那可能指的就是手机原厂设置。在不同的场景中，专业术语是不一样的。

另外还有不同拾音设备导致的信道差异，现今我们可见到的手机拾音信道、电话通话信道，是比较普遍的信道。但还有一些特别的拾音设备，它们的采样率、音频失真情况等都具有自己的特点，那业界任何一家公司的通用识别效果，都会因此出现明显的下降。而这，也是行业当前普遍面临的痛点。

思必驰高级技术总监、语音应用技术负责人薛少飞

“只有解决这些问题，AI技术才能够真正的落地到业务场景。”薛少飞说，基于此，思必驰推出了识别自训练平台，赋能客户自己做识别系统端到端体验的优化。首先，它可以完全私有化部署在客户场景当中，具有很强隐私性，解决了敏感数据的安全合规问题；其次，它的功能强大，支持数据标注、声学模型自定制、以及包括段落文本、热词、敏感词在内的各级语言模型自定制；此外，它是一体化的方案，能够赋能客户完成分钟级、一键式的自训练。

当前，识别自训练平台处于2.0版本，在即将发布的3.0版本中，还将发布端点检测自训练、标点断句自训练等新功能，并支持增量学习方案等新特性。

通过思必驰识别自训练平台，客户能够运用自有的行业数据，持续提升在自己行业领域的竞争力；思必驰作为纽带和能力输出方，并不去做客户行业的应用，客户可以没有任何后顾之忧的使用，实现产品持续迭代。

在首届智能家电语音识别与交互技术高峰论坛上，薛少飞重点分享了关于技术趋势的思考。

首届智能家电语音识别与交互技术高峰论坛

薛少飞认为，在家电厂商这端，自训练将赋能家电厂商产品级定制能力，使原有的冗长的交付链路，升级为产品级快速自定制。

而在家的场景中，人机交互体验将实现从“人与单一设备交互”到“人与设备矩阵的交互”的升级。就近唤醒与自然交互，将为家居场景带来更流畅的体验；声音、图像、视频、传感器技术的深度融合，则能够让家居体验更加智慧。结合VR和AR的虚拟家庭管家，也将出现在我们的家中。

AI先行者大会丨思必驰：通向语音落地的“最后一公里”

相关文章

人工智能企业

人工智能硬件

人工智能产业

人工智能技术