合合信息携智能文字识别技术亮相2021世界人工智能大会
2021-07-07 15:37:21AI云资讯804

大会现场,合合信息通过智能文字识别技术,识别出3600年前中华文明的古老文字——甲骨文。现场展示的复刻在龟甲上形象丰富的甲骨文,通过技术的的提取与翻译:“白富美”、“买它买它”等网络热词被识别翻译出来。据介绍,目前这一技术处于内测阶段并首次在人工智能大会上展示,安阳殷墟景区作为这一技术的学术支持单位。

甲骨文作为我国最早的成熟文字、世界四大古文字之一,因刻写在龟甲和兽骨上而得名。这些甲骨碎片被埋在地下多年,经历了地下活动的冲击和挖掘造成的磨损,多数甲骨残缺严重;又由于随着人类历史的迁徙遍布于世界各个角落,很难有完整的信息。随着人工智能的引进,通过图像识别技术,可以实现甲骨的自动识别、撮合,为甲骨文学者提质增效。
智能文字识别技术主要包含了智能图像处理,基于深度学习的复杂场景文字识别,自然语言处理三个核心技术层。智能图像处理技术主要对用户拍摄的复杂文档图像进行预处理,使得文档图像质量得到大幅度提升。例如对图像进行增强,让图像看起来更清晰,对形变图像进行还原矫正,对图像中因光照不均产生的阴影问题进行处理,对不同角度拍摄的图像进行定位和透视变换矫正。基于深度学习的复杂场景文字识别技术主要利用合合信息自研的手写印刷混排识别,抗强干扰识别,扭曲文字识别,复杂印章和手写识别等一系列先进深度学习识别技术来解决各种不同复杂场景下的文字识别问题。而自然语言处理技术,则是对识别出的结果进行进一步的语义理解。
合合信息相关负责人表示:“我们生活中常见的智能文字识别技术,绝大部分针对的是手写或印刷版的现代汉字。甲骨文识别的难点在于甲骨残缺严重、素材难获取、拓片清晰度低等难点,这些都是需要通过技术来解决。例如样本素材少,从技术层面上,我们需要解决少样本训练的问题。目前我们主要是初步研究,更多的工作还在路上。”
目前,合合信息的智能文字识别技术支持中、英、俄等56种语言的文档图像、100+种证件的快读智能分类,以及全球不同国家、不同行业的卡证、票据、定制识别等多个AI场景的产品和解决方案。
相关文章
- 合合信息发布多模态大模型文本智能白皮书,五大核心能力标准引领复杂文档处理变革
- 沙利文发布AI行业最佳应用实践报告,合合信息旗下AI Agent产品入选
- 多模态文本智能实力获得认证,合合信息INTSIG DocFlow斩获InfoQ重磅奖项
- 合合信息TextIn亮相火山引擎Force大会 助力大模型文本智能终端应用场景
- 合合信息入选“科创板价值50强”,多模态文本智能技术助推AI应用升级
- 让智能体开发如“拼积木”般便利!合合信息携手火山引擎共探大模型落地新范式
- 合合信息与上海交通大学开展课题合作研究,共探智能文档图像处理前沿技术
- 《数据产业图谱(2025)》权威发布,合合信息作为核心企业参编
- 合合信息联合南京大学苏州校区举办高校快闪日,共育AI未来人才
- 突破复杂版面及图表解析难题,合合信息“大模型加速器”再升级
- 中国信通院携手合合信息启动“护证计划”,AI鉴伪技术守护群众身份安全
- 网安标委2024年“标准周”活动顺利举行,合合信息AI助力图像鉴伪技术创新
- CCF-CV携手合合信息打造技术分享论坛,聚焦大模型时代中的视觉安全前沿热点
- 用AI“读懂”专业文档资料,合合信息助力出海企业规避侵权“陷阱”
- 解决文档应用开发“水土不服”问题,合合信息智能文档处理“百宝箱”亮相1024程序员节
- 做好个人信息保护“守门员”,合合信息入选首批PIA典型案例集
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









