百度千帆发布端到端文档智能模型Qianfan-OCR
2026-03-20 14:18:56AI云资讯1465
3月19日消息,百度千帆正式发布全新端到端文档智能模型 Qianfan-OCR。该模型基于统一的视觉语言架构,以4B参数规模实现了对文档解析、版面分析、文字识别与语义理解的全面融合,在多项权威评测中取得领先表现。目前,Qianfan-OCR已在千帆平台上线,并同步在HuggingFace开源了模型权重,面向开发者与企业用户开放使用。
据介绍,在核心Benchmark中,Qianfan-OCR表现尤为突出。在 OmniDocBench v1.5上取得 93.12分的成绩,端到端模型中位列第一;OCRBench远高于同尺寸通用视觉语言模型和专用OCR模型;在关键信息提取(KIE)的多个公开榜单总分上,超过了Google Gemini 3-Pro等商用模型。

在图表理解等复杂任务中,端到端模型的优势更加明显,Qianfan-OCR在ChartQA、ChartBench等6项图表理解复杂任务中,拿下了5项最佳成绩,展现了强大的结构理解与多模态推理能力。
传统 OCR 系统普遍沿用“检测+识别+LLM”三段式Pipeline架构。这一模式虽已工程成熟,但多阶段串联处理会在各环节不断放大误差,且文本逐块提取过程中原有的空间结构与视觉上下文信息往往遭到破坏,使得图表、复杂表格等内容的理解能力受到明显制约。
Qianfan-OCR 从底层架构出发进行重构,通过统一的端到端视觉语言模型,直接从文档图像生成结构化结果,完整保留视觉信息,实现从“看见文档”到“理解文档”的一步直达,在结构理解与推理任务中具备更高的一致性与准确性。
Qianfan-OCR在文档解析与理解一体化能力上的领先表现,进一步验证了端到端技术路线的可行性与先进性,标志着文档智能能力正从“流程拼接”迈向“模型统一”的新阶段。
目前,Qianfan-OCR已在百度千帆平台正式上线,并同步在 HuggingFace 开源模型权重,欢迎开发者与企业用户体验使用。
相关文章
- 百度生成式推荐系统亮剑GTC 2026,从“匹配”到“生成”重构商业AI技术版图
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 从“百城送龙虾”到“龙虾全家桶”,百度智能云推动OpenClaw走向产业落地
- 小熊电器与百度智能云达成战略合作,AI驱动小家电智能升级
- 告别B2B“增长焦虑”,百度爱采购2026开年一课揭秘中小企业如何靠AI实现“降本增效”!
- 百度举办北京首场“龙虾”市集,现场发布零部署服务DuClaw
- 百度App开学季上线文心老师,打造免费学习机
- 让国宝“在线重生”:百度百科3D复原圆明园十二生肖喷水铜兽,沉浸式呈现历史细节
- 2025年百度AI原生营销服务收入同比增长301%
- 百度商家智能体对话近450万次,数字人线索直播助力商家转化率涨三成
- 500万用户追捧!百度地图岳云鹏文心AI副驾对话破亿,春节互动数据亮眼
- 白龙马变身文心AI副驾?岳云鹏携手百度地图上天津春晚,送出2亿红包!
- MongoDB与百度智能云达成战略合作,打造全球领先的AI原生数据库生态
- 百度百科推出国际版BaiduWiki,正式迈入全球化知识服务阶段
- Omdia报告:百度智能云领跑中国具身智能AI云市场
- 《运输策略蓝图》发布 百度杨楠:香港是孵化自动驾驶业务的宝地
人工智能企业
更多>>人工智能硬件
更多>>- 无折痕折叠旗舰引爆市场:OPPO Find N6首销日湖南门店现抢购热潮
- AMD锐龙 AI MAX+ 392 移动处理器加持 华硕天选Air 2026 锐龙 AI Max版开启高效学习
- 聚焦 COSP 户外展:BleeqUp 超影擎如何用 AI 眼镜重新定义户外运动交互?
- 一加 15T 搭载 LUMO 凝光影像系统,3.5 倍潜望长焦加持拍人拍景更出彩
- 技嘉 32 英寸 240Hz QD-OLED 电竞显示器 MO32U24 正式上市
- 技嘉RTX 50系显卡超频表现亮眼 3DMark多项测试获高分
- 轻薄、AI、数日续航、性能强劲,第三代英特尔酷睿Ultra新品重磅上市
- 释放极致游戏性能!英特尔酷睿Ultra 200S Plus发布









