腾讯云OCR评测研究报告获AIIA批准并正式立项
2020-01-17 12:47:45AI云资讯715
1月13日,中国人工智能产业发展联盟2019年第四次全体大会在北京召开,会上,腾讯云AI视觉团队组织撰写的《OCR产业应用及评测需求研究报告》获得与会专家的认可,并顺利通过立项。该报告是腾讯公司联合中国信息通信研究院、中国人工智能产业发展联盟共同成立的“智能产品安全与评测联合实验室”的首个研究成果。
OCR(Optical Charater Recongnition)全称“光学字符识别”,即利用光学技术和计算机技术将印制或书写与纸张上的文字读取出来,并转换成计算机可读取、人可以理解的格式。作为实现文字高速录入的关键技术,OCR目前已广泛应用于政府、金融、交通、教育、泛互联网等多个领域。然而,不同应用场景中OCR数据类型差异化很大,每个应用场景都对OCR引擎有不同的要求。例如,金融和交通领域的OCR数据多是结构化的卡证类数据,如身份证、银行卡、驾驶证等,而卡证数据简单、场景安全性要求高,因此对OCR引擎的识别准确率要求会比较高;在教育、泛互联网领域中,多为算式、表格、广告图片、游戏图片等非结构化数据,对OCR引擎的识别准确率要求会相对较低。
目前,业界尚未有统一的、标准化的OCR引擎评测方法,导致OCR应用市场鱼龙混杂,阻碍了OCR技术在不同领域的良性发展。
基于腾讯优图提供的腾讯云OCR文字识别技术,以及在多个行业里的AI应用实践经验,腾讯云AI视觉团队启动了《OCR产业应用及评测需求研究报告》(以下简称“研究报告”)的编纂工作,分析OCR在应用中的评测场景、样本分类及评测的关键指标。
按照不同的应用场景,《研究报告》将OCR引擎划分为“卡证类文字识别”、“票据单据识别”、“汽车相关识别”、“行业文档识别”和“通用文字识别”,基本覆盖主流的OCR应用场景。针对不同的OCR引擎,《研究报告》也建立了不同的标准评测样本集。
对于评测的关键指标,《研究报告》将其划分为“效果指标”和“性能指标”两类。例如,针对身份证、行驶证等字段准确率要求高的场景,主要看字段级的效果指标,针对通用文字、行业文档等场景,主要看字符级的效果指标。
与会专家认为,基于OCR应用领域的广泛性,无法用单一的标准和评测样本集来衡量OCR在不同领域的表现,因此,分场景建立权威的评测标准,将有助于更快速地推进OCR技术的产业化落地。
相关文章
- 探讨AI赋能企业转型出海新路径!“腾讯云 TVP 思享会 大湾区数字化转型高管沙龙·香港站”成功举办
- 中国太原煤炭交易中心与腾讯云深化合作 共建煤炭价格指数大模型
- 与AI共生,腾讯云携手行业专家共话数智驱动新质生长
- Gartner®首次发布中国DLP市场指南,腾讯云零信任iOA入选代表厂商
- 腾讯云姚一兆:用全栈AI助力具身智能赛道加速发展
- 腾讯云领跑亚太反欺诈领域,获评Forrester Wave™“领导者”
- 腾讯云无锡峰会:腾讯云服务80%江苏头部民企 混元大模型等AI全栈产品加速进化
- 2025H1中国数据库市场头部竞争:腾讯云TDSQL公有云、本地部署增速“双第一”
- 腾讯云王麒:以场景为核心,构建真正好用的企业级智能体
- 海马云与腾讯云签署战略合作协议,共建AIGC内容创作平台新生态
- AI音频内容创作更高效,腾讯云“音频超能力”亮相2025中国新媒体大会
- 大模型+反诈+算力三重突破 腾讯云三项成果闪耀金融科技应用场景大赛
- 中东AI迎来中国力量 华为腾讯云万兴科技等深度赋能区域数字化升级
- 腾讯云与 eMAG 达成战略合作 共推东欧电商数字化升级
- 连续入选!腾讯云列入Forrester终端管理平台全景报告代表厂商
- AI防护,与时俱进:信通院X电子科大X腾讯云共话大模型安全









