深度学习技术解决表格识别难点,合合信息表格识别功能获用户青睐
2022-10-09 11:49:14爱云资讯
表格大小、种类与样式复杂多样,例如表格中存在不同的背景填充,不同的行列合并方法,不同的内容文本类型等。并且现有文档既包括现代的、电子的文档,也有历史的、扫描的手写文档,它们的文档样式、所处光照环境以及纹理等都有比较大的差异。因此,表格识别一直是文档识别领域的研究难点。好在,合合信息智能文字识别技术让高精度表格识别成为现实。
在16年领域深耕中,合合信息智能文字识别技术覆盖了图片、PDF格式文档中多种类的表格识别需求,包括有线表,三线表,无线表等,并且支持合并单元格、多表格并存等复杂情况的识别。
基于分治思想,合合信息引入深度学习技术,将表格识别分为有线表识别和无线表识别两种方案。有线表识别中,合合信息利用语义分割、角点回归等技术方案还原有线表,在财报相关表格识别测试中,有线表识别单元格结构准确率高于98%。无线表识别则采用序列模型、规则匹配等方案,通过自研模型直接预测表格的逻辑结构,再得到表格的物理结构,在保证表格区域内容的完整性的同时,检测准确率较传统方法显著提升。
现阶段,合合信息智能文字识别技术中的表格识别技术已被应用于以“扫描全能王”为代表的C端APP中,通过“文件转换excel”功能服务于大众生活和办公需求。近半年来,“文件转换excel”相关功能累计被调用百万次。
B端领域中,作为合合信息智能文字识别引擎中的重要模块,表格识别技术已落地在保险、银行、证券等行业中,应用于合同、银行流水、物流单据识别等多个场景。
据悉,合合信息是一家人工智能及大数据科技企业,从2006年创立至今,坚持深耕智能文字识别应用及商业大数据核心技术领域,通过C端、B端产品以及行业解决方案,为全球百余个国家和地区的亿级用户及近30个行业的企业客户提供创新的数字化、智能化服务。
近三年来,合合信息先后在ICDAR、ICPR等人工智能国际竞赛中斩获15项冠军,学术成果在CVPR、AAAI、ACL、ACM MM等顶会上发表,相关项目获中国图象图形学学会(CSIG)科技进步奖二等奖。在今年8月的CSIG图像图形技术挑战赛中,合合信息参与的赛队夺得总冠军。
- 共创数据场景价值,上海数交所携手合合信息举办数据资产管理与创新应用专题研讨会
- 智能文档处理助力国央企数字化转型,合合信息AI赋能“新质生产力”构建
- 年过完了,车厘子都吃完了吗?合合信息扫描全能王“拍照计数”助力物品高效盘点
- 合合信息与华为正式达成鸿蒙合作,共拓新流量与新商机
- 助力乡村振兴 合合信息启信宝获“重庆征信杯”优秀奖
- 合合信息参与工行“工银e申贷”战略合作伙伴签约
- 合合信息构建安全“防火墙”,AI科技创新安全应用场景再下一城
- 第五届长三角商业创新大会成功举行,合合信息AI助力数字经济新发展
- 合合信息亮相“海聚英才”全球创新创业峰会,政企研合力推动AI人才培养
- CIIS 2023|聚焦文档图像处理前沿领域,合合信息AI助力图像处理与内容安全保障
- 合合信息携手腾讯云推出票据智能方案,助力企业出海“扬帆远航”
- 合合信息启信慧眼“AI+商业大数据”赋能医药企业合规排查
- 2023清华博士团暑期社会实践项目圆满结束,合合信息助力科技人才发展
- 合合信息智能文字识别技术“牵手”传统典籍研究 开启古彝文“传统的新生命周期”
- 合合信息商业大数据解决方案入选中国信通院高质量数字化转型典型案例集
- 同济大学软件学院走进合合信息,共探科技人才培养新范式