台媒称百度AI即时翻译工具实现突破:挑战谷歌

2018-10-26 10:06:01爱云资讯

台媒称,百度推出一款人工智能工具,可以即时将英语翻译成中文和德语,以挑战谷歌(Google)的竞争产品。

10月24日报道,许多在线翻译服务允许用户说或写一句话,但翻译的过程会延迟。相比之下,百度即时翻译工具可以在句子说出来的同时进行翻译。该产品是百度的一大突破,在过去几年将重金投资人工智能,希望构建公司的未来业务。

人工智能领域,两种语言的“即时互译”是一项难以攻克的技术问题,其主要原因在于源语言和目标语言之间存在较大的词序和语序差异。

参考消息网-出海记记者了解到,近日,百度研发了具备预测能力和可控延迟的即时机器翻译系统,可实现两种语言之间的高质量、低延迟翻译。

机器同传利用语音识别技术自动识别演讲者的讲话内容,将语音转化为文字,然后调用机器翻译引擎,将文字翻译为目标语言,显示在大屏幕或者通过语音合成播放出来。相比人类译员,机器最大的优势是不会因为疲倦而导致译出率下降,能将所有“听到”的句子全部翻译出来,这使得机器的“译出率”可以达到100%,远高于人类译员的60%-70%。同时,在价格上也占有优势。

为了降低延时提升翻译质量,人类译员通常对演讲内容进行合理预测,百度开发人员从人类译员身上获得启示,研发了“wait-k words”模型,可以根据历史信息,直接预测翻译中目标语言词汇。该模型在翻译质量和翻译延迟之间做出了很好的平衡,用户可通过根据实际需求设定延迟时间(例如延迟1(k=1)词或延迟5(k=5)词)。比如,法语和西班牙语这种较为接近的语言,延迟可设置在比较低的水平;但是,对于英语和汉语这种差异较大的语言,以及英语和德语这种词序不同的语言,延迟应当设置为较高水平,以便于更好地应对差异。

在同声传译时,经常会遇到不同领域的专业知识,这就要求同传人员在短时间内吸收大量相关领域的内容,这对他们也是极大的挑战。基于此,百度模仿人类同传的准备过程,提出了快速融合领域知识策略。该策略依托百度互联网大数据,训练得到的具有通用翻译能力的模型;当它接到某一个领域的同传翻译任务时,系统会收集该领域数据并在通用模型的基础上进行增强训练,得到相应领域增的强模型;最后对该领域术语库进行强制解码,使专业术语翻译得准确可靠,且提升翻译效率。

作为对外开放和商业国际化的需求之一,同声传译被广泛应用于政府间的峰会、多边谈判和其他商业场合,但是同传人员稀缺也成为了当前的棘手问题。为了解决全球范围内同传译员人数少、费用高等难题,越来越多开发者专注于机器同传的研发,百度也希望通过研发高质量机器同传技术和系统解决即时翻译难题。

虽然机器同传有了新的突破,但它与经验丰富的同传人员相比,依然存在一定差距。百度翻译技术负责人表示,同传的目的并不在于取代人类译员,而是为了降低同传成本,让同传的应用范围更加广泛,也希望世界各地的人在AI的助力下早日实现“无障碍”交流。

相关文章
热门文章
头条文章
重点文章
推荐文章
热点文章
关于我们|联系我们|免责声明|会展频道
冀ICP备2022007386号-1 冀公网安备 13108202000871号 爱云资讯 Copyright©2018-2023