突破物理AI感知领域核心技术难题, 智慧互通(AICT)荣获中国电子学会科技进步一等奖
2026-05-21 10:24:58AI云资讯1886
凭借在物理AI与开放环境图文识别领域的重大技术突破与规模化落地应用,智慧互通(AICT)与北京科技大学、中国科学院自动化研究所等单位联合申报的“面向开放环境的低质图像表征与复杂图文识别技术及应用”项目荣获“2025中国电子学会科学技术奖”科技进步奖一等奖。
该项目深度融合物理 AI领域技术创新,成功攻克了人工智能感知领域多项世界级难题,深度服务国家网络信息安全、智能交通、智慧教育等重大战略,产生了显著社会与经济效益。

技术突破:攻克物理AI驱动的开放环境图文识别世界级难题
该项研究聚焦物理世界真实场景,以物理 AI 为核心底座,旨在解决开放环境自适应感知与图文识别中存在的低质图像表征难、开放模式分类差、神经网络计算慢”是其中公认的技术难题。
由于噪声复杂、类别开放、资源受限的特点,基于物理 AI的开放环境自适应感知与图文识别成为人工智能领域迫切需要解决的核心问题,是国际人工智能感认知技术发展新的制高点,也是互联网信息安全国家战略需求和智慧教育、智能交通等国家重要行业智能化发展的共性关键技术。
针对这些难点,智慧互通(AICT)研发团队与其他项目组成员一起,基于物理 AI技术体系,共同提出了低质图像判别表征、开放模式语义建模、网络模型高效计算等自适应图文识别关键技术。
关键创新:实现图文识别领域三大技术突破
在各方团队共同努力下,项目物理 AI前沿技术实现了一系列技术创新:
在开放低质数据自适应的图像特征判别表征方面,基于物理AI感知机理,实现了开辟了噪声图文关系表征与提取的新技术路径,实现了从“已知结构提取”到“未知结构表征”的范式变革,开放环境下无约束大规模车辆检测精度达 96.85%,比国际最新技术(Meta)高15.85%。
在开放复杂模式自适应的图文类别语义建模方面,融合物理 AI开放场景理解能力,开创了开放集图文识别技术,实现了从“闭集模式分类”到“开放模式识别”的范式变革,开放集文字识别精度从原代表性方法(百度)35.40%跃升到89.52%。
在受限计算资源自适应的图文模型高效计算方面,结合物理AI边缘部署需求,开辟了深度神经网络联合优化压缩的新技术路径,在业内率先设计了软硬协同的高效图文识别SoC芯片,获2019年国际深度神经网络压缩与加速竞赛冠军,综合得分比美国高通公司技术高129.19%。
成果落地:赋能国家战略与多行业规模化应用
项目开创了物理 AI驱动的开放集图文识别领域,构建国家级重大应用系统,实现规模化落地,深度服务国家战略与行业智能化升级:
支撑网络信息内容安全,建成国家级互联网图文识别与信息实时分析系统、国家广电媒体图文识别与内容监测系统,开创了文字识别及智能识别技术国家级互联网超大规模实际应用的国内先河。
助力重点场景与行业智能化,应用于2022北京冬奥会张家口赛区车路感知与智慧交通、边远少数民族地区中小学智慧教育等物理 AI典型落地场景。
产生显著经济社会效益,近三年直接经济效益45.68亿元、利润18.32亿元,在国家相关管理中心、北京冬奥会、腾讯等单位/场景广泛应用物理 AI图文识别技术,产生了重大的社会和经济效益。
相关文章
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









