合合信息携智能文字识别技术亮相2021世界人工智能大会
2021-07-07 15:37:21爱云资讯
大会现场,合合信息通过智能文字识别技术,识别出3600年前中华文明的古老文字——甲骨文。现场展示的复刻在龟甲上形象丰富的甲骨文,通过技术的的提取与翻译:“白富美”、“买它买它”等网络热词被识别翻译出来。据介绍,目前这一技术处于内测阶段并首次在人工智能大会上展示,安阳殷墟景区作为这一技术的学术支持单位。
甲骨文作为我国最早的成熟文字、世界四大古文字之一,因刻写在龟甲和兽骨上而得名。这些甲骨碎片被埋在地下多年,经历了地下活动的冲击和挖掘造成的磨损,多数甲骨残缺严重;又由于随着人类历史的迁徙遍布于世界各个角落,很难有完整的信息。随着人工智能的引进,通过图像识别技术,可以实现甲骨的自动识别、撮合,为甲骨文学者提质增效。
智能文字识别技术主要包含了智能图像处理,基于深度学习的复杂场景文字识别,自然语言处理三个核心技术层。智能图像处理技术主要对用户拍摄的复杂文档图像进行预处理,使得文档图像质量得到大幅度提升。例如对图像进行增强,让图像看起来更清晰,对形变图像进行还原矫正,对图像中因光照不均产生的阴影问题进行处理,对不同角度拍摄的图像进行定位和透视变换矫正。基于深度学习的复杂场景文字识别技术主要利用合合信息自研的手写印刷混排识别,抗强干扰识别,扭曲文字识别,复杂印章和手写识别等一系列先进深度学习识别技术来解决各种不同复杂场景下的文字识别问题。而自然语言处理技术,则是对识别出的结果进行进一步的语义理解。
合合信息相关负责人表示:“我们生活中常见的智能文字识别技术,绝大部分针对的是手写或印刷版的现代汉字。甲骨文识别的难点在于甲骨残缺严重、素材难获取、拓片清晰度低等难点,这些都是需要通过技术来解决。例如样本素材少,从技术层面上,我们需要解决少样本训练的问题。目前我们主要是初步研究,更多的工作还在路上。”
目前,合合信息的智能文字识别技术支持中、英、俄等56种语言的文档图像、100+种证件的快读智能分类,以及全球不同国家、不同行业的卡证、票据、定制识别等多个AI场景的产品和解决方案。
- 共创数据场景价值,上海数交所携手合合信息举办数据资产管理与创新应用专题研讨会
- 智能文档处理助力国央企数字化转型,合合信息AI赋能“新质生产力”构建
- 年过完了,车厘子都吃完了吗?合合信息扫描全能王“拍照计数”助力物品高效盘点
- 合合信息与华为正式达成鸿蒙合作,共拓新流量与新商机
- 助力乡村振兴 合合信息启信宝获“重庆征信杯”优秀奖
- 合合信息参与工行“工银e申贷”战略合作伙伴签约
- 合合信息构建安全“防火墙”,AI科技创新安全应用场景再下一城
- 第五届长三角商业创新大会成功举行,合合信息AI助力数字经济新发展
- 合合信息亮相“海聚英才”全球创新创业峰会,政企研合力推动AI人才培养
- CIIS 2023|聚焦文档图像处理前沿领域,合合信息AI助力图像处理与内容安全保障
- 合合信息携手腾讯云推出票据智能方案,助力企业出海“扬帆远航”
- 合合信息启信慧眼“AI+商业大数据”赋能医药企业合规排查
- 2023清华博士团暑期社会实践项目圆满结束,合合信息助力科技人才发展
- 合合信息智能文字识别技术“牵手”传统典籍研究 开启古彝文“传统的新生命周期”
- 合合信息商业大数据解决方案入选中国信通院高质量数字化转型典型案例集
- 同济大学软件学院走进合合信息,共探科技人才培养新范式