传神语联加持NLP硬核科技 探索多语信息领域新突破

2022-07-07 16:55:56爱云资讯

随着全球化网络时代的到来,人们依托数据推荐获取更精准的信息,在接受多样化信息的同时,也面临着语言障碍问题。实现任意时间、任意地点、任意语言的无障碍自由沟通是人类追求的一个梦想。也是全球化、数字化背景下的一个行业缩影。因此技术的融入,赋予了人们快速跨越语言障碍的方式方法,更便捷更高效的满足信息转化的需求。

人工智能领域皇冠上的明珠

微软亚洲研究院原副院长、创新工场首席科学家、ACL前主席周明博士曾提及,“自然语言理解是人工智能领域皇冠上的明珠,自然语言处理技术(NLP)是人工智能赋能社会和赋能行业的硬核科技。”

自然语言处理技术,就是使机器人或计算机设备从标准格式化的问答,变得会学习、有知识、会思考、善交流。包括人们日常用到的搜索引擎、各种智能交互场景,都需要自然语言处理技术的支撑。

随着互联网的发展,用户接触的信息量是20年前的1000倍,从当初的电视、报纸,广播,到现在的PC端、移动端,对语言翻译效率提升的要求亦越来越多。

“当我们浏览国外网站、新闻资讯等内容时,如果没有语言翻译就等于看不懂的‘天书’,只是一页页字符,让人很迷茫。”传神语联董事长何恩培接受采访表示, 当前的人工翻译每年处理的字符量是1500亿,而机器翻译调用的字符量每天就在8000亿至10000亿之间,这表明信息处理空间达到2400倍。

随着信息量的增加,未来十年还会从目前经常用到的60对语言进化到150对。按照中国国标,翻译的准确率要求高达99.7%,而今天的机器翻译准确率难以超过70%。

人工翻译准确率高但效率低、成本高;而机器翻译效率高、成本低但准确率不高。如何将二者优势结合,创造出兼具高准确、高效率、低成本的翻译服务模式,正是自然语言处理领域最具价值的命题之一。

传神语联正在打造或肩负这样的角色与使命,不断探索。既不执着于传统的人工翻译,也没有执着于机器翻译。

探索多语智能,求解千年难题

事实上,翻译作为沟通世界的纽带与基础要素,早在东汉就有记载。随着全球化深入和数字化时代到来,翻译不再只是满足高端人士的工作需求,而是深入人们生活的各个场景与基础生活需求,如购物、知识获取、社交等多语需求场景,无时不在,无处不有;未来,新的应用场景像电网上电器一样,不断增长。

以上场景的应用,就需要强大的自然语言处理。而当前,一般的机器翻译引擎都只能在简单的新闻稿等领域有比较好的表现,在复杂的专业领域则无法胜任。普适性的机器翻译在广泛使用上,也已遇到瓶颈。

在此大背景下,建设语联网的大胆想法涌入何恩培的脑海,并在心底生根发芽。

从2011年设想至2021年普遍应用,传神语联用了10年时间。从调研、论证到技术探索与创新,一次次的自我革命,终于等来传神语联“人+机器,孪生译员”诞生的这一刻。

“孪生译员”模式,通过设置“场景边界”的方式,跟踪一个翻译组织乃至一名译员的翻译过程,在翻译结果、上下文等场景化数据中进行学习,建立多维度异构模型并持续迭代,让每个翻译组织或译员,都可以将自己的翻译经验、风格数字化克隆,形成具有专属特征的孪生翻译引擎。同时,将自己的翻译资产,变成24小时躺着赚钱的服务能力。

例如文本解析、智能聚类、智能分拆、智能匹配、智能纠错、智能合并等一系列技术,都将在这一过程中发挥作用,组织起几十、几百乃至几千名翻译人员同时处理一个翻译任务,并使得每个人都能够很好地完成自己的工作,从而远超人工翻译效率,并保证翻译结果。

展望20年后,无论人工智能发展到什么阶段,多少工作被人工智能所替代,语言文字的工作仍旧无可被替代。传神语联作为中国最大的、以技术驱的人工智能语言服务平台,将长期推动行业数字化转型,通过语联网开放平台,整合语言服务行业数据、信息、人才资源,将整合的资源与先进的AI技术融合为行业赋能释放更大能量。

相关文章
热门文章
头条文章
重点文章
推荐文章
热点文章
关于我们|联系我们|免责声明|会展频道
冀ICP备2022007386号-1 冀公网安备 13108202000871号 爱云资讯 Copyright©2018-2023