百度王海峰出席中国认知计算和混合智能学术大会 深度解析“多模态深度语义理解”
2018-08-28 11:25:13AI云资讯1513
中国认知计算和混合智能学术大会(CCHI2018)由国家自然科学基金委员会信息科学部、中国自动化学会与中国认知科学学会联合主办,是国内首个关注认知科学、神经科学与AI交叉融合的高端学术会议。本届大会邀请了认知建模与计算、混合智能、智能机器人、智能驾驶等领域海内外知名专家作学术报告,交流相关研究领域的最新成果和发展趋势。
王海峰是人工智能的领军人物之一,在国内外有广泛的影响力。他是自然语言处理领域最权威的国际学术组织ACL50多年历史上唯一出任主席(President)的华人,也是ACL亚太分会(AACL)创始主席。同时,王海峰是百度人工智能的奠基者和领导者,为百度创建和发展了自然语言处理、知识图谱、语音、视觉、深度学习等AI核心技术,并成立AI技术平台体系(AIG)担任总负责人,致力于AI相关技术的研究及其应用落地。

百度大脑迭代更新逐步加深对客观世界的认知
在大会报告中,王海峰分享了百度大脑的最新进展。百度大脑是百度AI技术多年积累和业务实践的集大成,包括视觉、语音、自然语言处理、知识图谱、深度学习等AI核心技术和AI开放平台,对内支持百度所有业务,对外全方位开放,助力合作伙伴和开发者,加速AI技术落地应用,赋能各行各业转型升级。
百度大脑的演进,从基础技术积累,到建立完整的技术体系,再到核心技术进入多模态深度语义理解阶段,同时伴随着百度多年的业务实践和AI能力的全面开放。
王海峰指出,AI技术与产业的结合愈发多元化,单一技术已无法满足应用需求,具备“多模态深度语义理解”能力的百度大脑通过多技术融合,能让机器对客观世界有更深层认知,从而更好的支撑应用。
百度大脑新阶段:多模态深度语义理解
“多模态深度语义理解”是指对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言理解等多方面的语义理解技术。“多模态深度语义理解不仅能让机器听清、看清,更能深入理解它背后的含义,深度地理解真实世界,进而更好地支撑各种应用。”王海峰解释。
在 AI 领域,数据的重要性不言而喻。无论是物理世界、人类社会还是网络空间,都汇聚了海量的多元、异构、多模态数据。数据语义化技术可以将这些数据形成包含千亿节点、万亿关系的庞大数据语义网络,从中总结规律、提炼知识、发现价值,助力经济和社会发展。王海峰介绍,数据语义化技术已经在生产生活中发挥作用,比如在新能源充电桩运维中,利用百度的数据语义化技术进行设备监测、故障诊断等,可以显著提升效率,节约成本。
除了数据,理解并运用大千世界中的多元知识也是AI技术进一步突破、深层次理解客观世界的重要基础。百度已经构建了包含数亿实体、数千亿事实的庞大知识图谱。除了基础的由实体、属性、关系构成的实体图谱,百度还针对不同的应用场景和知识形态,构建了关注点图谱、事件图谱、多媒体图谱、行业图谱等多种知识图谱。
视觉语义化可以让机器从看清到看懂视频,并提炼出结构化语义知识。王海峰通过体育比赛视频的案例,展示了视觉语义化技术的价值。他介绍,2016年,百度AI实现了奥运会篮球比赛的自动解说,背后是自然语言处理和搜索技术。如今,应用视觉语义化技术对世界杯比赛视频进行解析,AI能够全面识别视频中的球员、裁判、球、以及球门、球场线等人、物和场景,可以捕捉射门、进球、角球、任意球、换人等事件,形成比赛的语义化知识,既可以实现机器人解说比赛,也可以进行精彩片段集锦、以及各种数据统计分析等更深层的应用。
语音语义一体化技术让机器听得更清楚准确,实现更自然的人机对话。王海峰介绍,百度采用多语种声学混合建模,中文的Deep Peak 2模型效果比业界最好竞品错误率相对降低20%; WaveNet+拼接的情感语音合成技术,既可以使机器发声的自然度大幅提升,又避免了计算量过大的问题。
自然语言理解是人工智能最具挑战的技术领域之一,近年来取得的进展已经释放出巨大的应用价值。王海峰介绍,在对话理解上,百度研发的深层注意力匹配模型,比已知的最好结果提升了4.1%,人机对话交互更加流畅自然。而在阅读理解上,百度大脑已经阅读了千亿量级的文章,相当于 6 万个中国国家图书馆的藏书,积累了亿级实体、千亿事实的知识,从而深入地理解内容、获取知识,支持更广泛的应用。
百度大脑的技术能力在不断进步,对外开放也更加全面和丰富。截至目前,百度已对外开放120多项领先的AI场景化能力与解决方案,并通过开源开放深度学习框架PaddlePaddle、定制化平台EasyDL等、实训平台AI Studio、软硬一体的AI能力,持续降低AI应用门槛,帮助开发者和企业应用AI实现业务创新与升级。
直面人工智能的机遇和挑战 为发展加速
人工智能技术发展迅速,在各行各业的应用落地正在变得更加广泛并开始走向深入。面对全社会掀起的人工智能热潮,我们更要清醒地认识AI发展的机遇和挑战。
在基础理论层面,小样本学习、低能耗的智能机制或许是人工智能面临的最大挑战。目前的深度学习技术都是建立在大规模样本、高能耗计算的基础之上,同时,深度神经网络的结果很难解释。因此,未来的人工智能理论研究,要探索如何让人工智能像人类一样,能够做到小样本学习,能耗低,且真正地被理解。
在应用技术层面,视觉、语音等感知技术在这一轮深度学习的浪潮中得到很大提升,甚至某些方面的能力已经超越人类。但在认知技术方面,无论是对语言的理解,还是对知识的掌握和应用,依然有很大的进步空间。因此,自然语言处理、知识图谱等认知技术,将是未来非常重要的研究方向。
从产业层面,一方面呈现出软硬结合的趋势,另一方面,深度学习框架和AI芯片也将是新的产业机会。“AI芯片能否在产业上成功,取决于围绕AI芯片建立起来的应用生态。其中,深度学习框架起到至关重要的作用,其意义相当于指令集和操作系统。”因此,王海峰认为,类似百度PaddlePaddle这样的深度学习框架,将会成为AI时代的重要基础设施。
在应用系统层面,多技术综合应用、结合场景的系统性创新至关重要。王海峰建议,研究者可以术业有专攻,但产业界,应关注公司的综合技术实力,特别是其工程落地能力。此外,结合特定场景和数据等特性的系统性创新,也是AI技术应用落地的必要条件。
人工智能经过60余年的发展,在互联网、大数据、大计算、脑科学等新理论新技术,以及经济社会发展需求的共同驱使下,正在进入一个崭新的时代。如今,它需要与更多不同领域的知识产生新碰撞,打造竞争新优势、开拓发展新空间。中国的AI之路也将不断注入新活力,走得长且远。
相关文章
- 百度智能云与帕西尼达成战略合作 共同推动具身智能产业规模化落地
- 百度智能云:加大三方面投入 解决具身智能产业硬问题
- 百度沈抖:自我进化,开启超级个体黄金时代
- 百度一镜升级,数字人进入“全场景+全球化”时代
- 百度智能云升级百度一见视觉智能体平台:内置1000+专业视觉Skills,可自主进化
- 百度智能云发起智慧养老产业联盟,8家企业首批加入
- 百度Create2026:AI Agent走进家庭,小度给出落地样本
- L4级自动驾驶车辆驶入中国农业大学 百度Apollo星火计划再落一子
- 百度百科20周年沙龙致敬百万UGC用户:让3000万+词条成为时代的知识方舟
- AI生万象,灵感疯长——百度百家号AI创作者漫谈大会圆满落幕
- 2026百度创作者大会:AI引擎赋能创作 共生共筑新生态
- 领跑中国乘用车NOA辅助驾驶地图市场份额 百度地图实力亮相2026北京车展
- 百度百科“繁星计划”再加码,投入2000万基金激励权威内容建设
- 行业首发!鸿蒙版雅迪智行App深度集成百度地图SDK,上线投屏导航,实现“抬头骑行,眼不离路”
- 百度APP用户数据再攀升:主动日活用户同比增长1.6倍、创作者规模同比增长近3成
- 行业首家!百度地图×雅迪首发支持鸿蒙投屏导航,两轮车智慧出行迈入“鸿蒙时代”
人工智能企业
更多>>人工智能硬件
更多>>- BOE(京东方)OLED技术赋能联想YOGA Air 14 Ultra 定义超轻薄AI PC新标杆
- iQOO 15T正式发布:天玑9500 Monster版加持 全能体验无短板
- 从“+AI”到“AI+”:天禧AI 4.0加持,联想AI主机领衔L3级终端震撼登场
- 拾年匠音,声来不凡,致敬1000X系列十周年 索尼发布1000X十周年典藏版头戴降噪耳机
- 出游露营正当时 三星Galaxy手机全方位守护你的户外体验
- 拯救者Y900系列生产力大屏AI平板正式发布,学娱场景随心换,打造新一代旗舰终端
- 智慧陪伴 定格浪漫 三星Galaxy A57 5G让你的520心意满分
- 短途出行机器人QUORRA X5出海订单覆盖欧美,头部资本加持正奇未来布局全球
人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









