聚焦2021全球人工智能技术大会 百度CTO王海峰阐述机器翻译技术及应用
2021-06-06 20:21:49AI云资讯713
6月4-6日,由中国科学技术协会、中国科学院、中国工程院、浙江省人民政府指导,中国人工智能学会、杭州市人民政府主办的2021全球人工智能技术大会在杭州召开。大会汇聚了来自世界各地的人工智能领域院士专家,共同为人工智能的发展建言献策。
6日下午,在多语种智能信息处理专题论坛上,中国人工智能学会(以下简称:CAAI)多语种智能信息处理专业委员会正式成立。国务院参事、CAAI理事长、中国工程院院士戴琼海,CAAI名誉理事长、中国工程院院士李德毅,中国工程院院士、新疆多语种信息技术重点实验室主任吾守尔·斯拉木发表致辞,来自学术界、产业界的多位重磅嘉宾带来了精彩报告。百度首席技术官、CAAI/ACL Fellow王海峰以《机器翻译:从梦想到现实》为题,介绍了机器翻译相关研究的重要成果和产业应用。
机器翻译迈入深度学习时代
机器翻译的发展历程可以追溯到1947年机器翻译设想的提出。在70多年的时间里,机器翻译经历了基于规则的方法、统计机器学习和神经网络机器翻译三个阶段,进入深度学习时代。
神经网络机器翻译的大规模产业应用面临高质量、多语言、跨模态的产业化需求。在翻译质量方面,百度研发了融合丰富特征的神经网络机器翻译模型,漏译率降低80%;多智能体联合学习模型,突破单一模型学习能力不足的限制;在国际权威机器翻译评测中获得第一名,翻译质量大幅提升。2015年5月,百度在全球率先上线大规模神经网络机器翻译产品。
在多语言翻译方面,针对语言数量多、语料分布不均衡、部署复杂、实现难度大等难题,百度研发了基于共享编码器的翻译模型,突破了低资源语言的翻译瓶颈,研制了多语言翻译统一框架,大幅提升部署效率,实现203种语言互译,支持41006个翻译方向。

机器同传方面,针对同传翻译质量与时延难以兼顾的痛点,百度打造了基于语义单元的同传模型,翻译准确率超过80%,时间延迟约为3秒,翻译水平媲美人类译员。同时,在端到端同传模型方面,突破了语音识别和机器翻译交互同步解码,实现跨模态知识共享。百度在机器翻译技术上持续创新突破的同时,也积极开放合作,联合Google、清华大学等举办机器同传研讨会、发布面向真实演讲场景的中英同传数据集,促进同传研究。
每天翻译超千亿字符,跨语言沟通正在成为现实
机器翻译是百度很早就开始积累和打造的AI技术之一。2010年以来,百度在大规模产业化机器翻译技术、海量翻译知识获取、多语言翻译、机器同声传译等方面均进行了系统而深入的研究,技术上不断突破创新,产业应用不断丰富。百度翻译已形成包括翻译PC版、翻译APP、AI同传、以及翻译开放平台等完整的产品矩阵,实时准确地响应全球海量复杂多样的翻译请求,每天翻译超过千亿字符,较十年前增长了十万倍。
截止目前,百度翻译已服务50多万家企事业单位和开发者,覆盖30多个领域,持续在人们生活工作、公共服务、科研学习等方面发挥作用:服务服贸会、进博会、全球人工智能技术大会等上百场重要国际会议;服务经济发展、助力跨国贸易平台/企业降本增效;免费开放生物医药领域翻译,与防疫志愿者小组等合作,助力全球抗疫等等。
资料显示,全球权威咨询机构Gartner发布《Hype Cycle for Natural Language Technologies, 2020》,将百度评为神经网络机器翻译标杆机构。百度是国内机器翻译领域唯一入围单位。2020年12月,Gartner在报告《Market Guide for AI-Enabled Translation Services》中提到,百度凭借在机器翻译方面出色的表现强势入围全球AI翻译服务代表性提供商。
报告最后,王海峰表示,百度将始终坚持技术创新,推动技术进步,为产业升级、社会经济高质量发展、国家繁荣昌盛做出更大贡献。
相关文章
- 全国人工智能发展大会 AI HANGZHOU 2026中国(杭州)国际人工智能展览会
- 亿达科创亮相国际人工智能展再获AI大奖
- 欢聚旗下百果园网络入选2025广州人工智能创新发展榜单
- 自主可控 智测未来|科大讯飞人工智能终端测试中心正式揭牌
- 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本
- 第九届数字中国建设峰会分论坛“人工智能产业发展和赋能新型工业化”主题交流活动在福州圆满落幕
- IBM咨询扩展人工智能能力,加速企业转型
- 点猫科技与新加坡华侨中学签署人工智能教育合作备忘录
- 许欢:人工智能应急大模型开启应急管理新发展时代
- 人工智能终端迎来“国家标尺” 联想以规模化产品实践助力标准编制
- SpaceX拟在得克萨斯州建设人工智能芯片工厂,总耗资达1190亿美元
- 微软放弃Xbox Copilot人工智能
- 人工智能助力新型工业化 第九届数字中国建设峰会工业智能产业生态大会成功举办
- 中兴通讯携手印尼XLSMART 在雅加达正式启动联合创新中心加速印尼 5G-Advanced 与人工智能发展与应用
- 马斯克出庭作证,诉讼指控OpenAI违背了打造惠及全人类的通用人工智能的核心使命
- 实力登榜!思特奇入选2026全国企业“人工智能+”行动创新案例TOP100
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









