声智科技:AI远场语音领跑者

2019-04-01 11:12:40爱云资讯

人工智能时代,语音交互被视为用户多场景下的主要流量入口之一。而真实的声场环境下, 远场语音技术的突破成为了解决诸多复杂问题的关键。

“‘远场语音交互’,是我们提的第一个概念。远场是所有技术的集合体,包括声学技术、唤醒技术、端点检测技术,和大家比较熟悉的语音识别、语义理解、语音合成等,这些内容关联在一起,才能解决用户遇到的问题,为用户创造价值。它意味着实现真正的、自然的人机交互,在人和人之间正常交互的距离内,可以真正释放双手。” 北京声智科技有限公司创始人、董事长兼CEO 陈孝良对记者说。

基于技术发展的阶段、市场的需求和自身的能力,陈孝良于2016 年创立了专注于声学语音技术和远场智能交互的声智科技。在此之前,陈孝良一直担任中科院声学研究所的副研究员,是名工学博士。为了让所学能造福更多人,他和他的团队毅然踏上创业征程。

强大的技术背景,让声智科技在创立不久后就获得资本青睐,还赢得了与百度、小米等巨头公司的合作。在这个竞争激烈的赛道上,作为一家新锐的创业公司,声智科技找到了自身的生存之道。

找准切入口

相较于拥有大量数据资源的巨头企业,创业公司更多的是通过深耕垂直赛道来实现自我成长。在商业化的探索中,声智科技找到了一个绝佳的切入口—智能音箱。

根据Canalys 数据显示,在2018 年四个季度, 全球智能音箱出货量分别达到900 万台、1680 万台、1970 万台和3850 万台,同比增长分别为210%、187%、137% 和158%。智能音箱市场潜力不容小觑。

“从这两年的市场表现来看,智能音箱是全球最成功的人工智能产品,是用户真正愿意付费购买体验的一款智能设备。智能音箱在全球以及中国的市场快速出量,验证了声智科技当时的选择。”陈孝良说。

不过,当前中国很多技术还在爬坡阶段,中国的智能音箱出货量还未达到预期。陈孝良表示: “从蓝海到红海的转变期有些长,这是留给创业公司的一个窗口期,但所有新兴的蓝海市场刚开始必然是需要培育的,而创业公司也要承担更多。虽然我们在智能音箱领域做得很多,但我们一样需要对不在声智科技核心体系内的很多事情做好支撑。”

目前,声智科技在全力开拓智能音箱市场的同时,更多的精力集中在开拓新的业务体系。其主要面向B 端提供远场智能交互系统SoundAI Azero 和开放平台服务,以及深度结合应用场景的人工智能技术和产品解决方案。

“当新兴市场开拓后,很快就会由蓝海市场变成红海市场,这时要保持一定的竞争策略。我们会不断开拓新市场以及在传统市场中用‘智能+’的方式进行升级,不断积累并做好技术与用户体验优化。去年声智科技已经开拓了一些行业市场,比如,运营商市场、金融市场。”陈孝良表示。

用户体验为先

远场语音技术需要解决多重复杂问题。举一个典型的例子,用户在房间中人机对话,会产生混响, 需要去混响的算法;有环境噪声,需要噪声抑制的算法;音箱在唱歌的时候,需要自噪声抑制的算法;用户每说一句话需要加标点符号,需要端点检测的算法;叫智能设备的名字,需要语音唤醒的算法;识别不同用户身份,需要声纹识别的算法等等。

通常来说,以上诸多问题是用户体验智能设备是否“智能”的关键所在,而技术则是其中最重要的能力之一。“我们非常关注这两点:第一是解决产品在真实场景的应用,第二是解决为用户服务的问题。这需要技术架构把声学和机器学习的方法融合在一起,这也是声智团队成员比较擅长的。凡是用户体验关注的东西都需要我们花很大的精力去解决。”陈孝良说。据了解,声智科技很早就重视唤醒率以及误唤醒率,包括识别远场,尤其是3-5 米的对话距离。

然而,这不仅仅只是纯粹技术的问题,也有工程阶段能力的问题。“比如如何将差异为1DB 或3DB 的传感器与产品完美融合,就需要建立一套标准的规范、测试条件以及量产时检测的方法。这需要声智科技付出很多包括声学结构的设计指导工作。声智科技的运营拓展部门,主要负责将研发技术真正落地到规模化生产。比较幸运的是声智科技的第一项技术3 个月后就应用在量产产品中了。前期的过程对我们是非常大的考验,但也是一个非常好的锻炼机会,让声智科技能获得快速生产的验证机会。”

敏捷管理模式

声智科技团队分工明确,如做软件的有UI 方向、算法方向;做算法分为声学算法、深度学习等, 还有做语义、做云端平台架构、做交付,以及做芯片系统开发等。这些差异明显的众多团队聚合发展,如何才能发挥协同效应?

陈孝良的答案是“敏捷管理”。“我们有一个比较重要的管理创新,也就是长链研发的敏捷管理。采用长链研发的敏捷管理模式,强调基于人才的场景管理,关注点会着重放在目标和进度的管理。”

与传统的目标管理中任务附带强KPI 考核性质不同,声智科技将整体战略目标分解到每个团队,且不将其和薪酬紧密挂钩。以“大平台+ 小团队”的敏捷管理模式,告别单一KPI 或OKR 导向,以期在其中找到平衡,寻求一种面向未来的新型管理方式。

“管理模式创新是我们一直在探索的,企业需要根据不同的人群使用更灵活、人性化的管理方式。希望我们的员工在未来的行业中能成为领军人物, 这是我们培养人才的出发点之一。大家是不是把它当成自己的一份事业来看待,而不仅仅是一项工作, 这是很重要的一件事。我们希望在人工智能领域有所作为,这是声智科技所有的管理方式能顺利推进的重要参考点。”陈孝良表示。

相关文章
热门文章
头条文章
重点文章
推荐文章
热点文章
关于我们|联系我们|免责声明|会展频道
冀ICP备2022007386号-1 冀公网安备 13108202000871号 爱云资讯 Copyright©2018-2023