容联云AI问鼎“千言数据集—实体链指评测“,持续打造知识语义计算能力
2022-05-24 12:35:11AI云资讯1051
容联云研发并积累了面向业务知识图谱敏捷构建与应用的核心算法能力,可快速响应业务需求,并利用“知识”增强现有的语义理解技术,解决用户的知识查询等问题。

近日,容联云知识及语义计算技术问鼎"千言数据集:实体链指评测。

“千言”是中国计算机学会、百度、中国中文信息学会发起中文自然语言处理数据共建计划,共同推动中文信息处理技术的进步。
作为人工智能领域处理大规模文本数据的核心技术的自然语言处理(NLP),它在信息检索、智能问答、智能推荐等众多领域扮演着重要的角色,具有很高的商业价值,实体链指(Entity Linking,EL)则是其中关键的研究课题之一。
本次举办的“千言数据集:实体链指评测,数据来自于互联网网页标题、UGC短视频标题、搜索Query。对于给定的一个中文短文本(如搜索查询、微博、对话内容、文章/视频/图片的标题等),EL将其中的实体与给定知识库中对应的实体进行关联。
相较于传统针对长文本的实体链指任务,此评测任务更强调短文本的语义理解,对模型的语义理解能力提出了更高的要求。长文本拥有丰富的上下文信息能辅助实体的歧义消解并完成链指。因此,中文短文本的实体链指存在很大的挑战,
主要原因如下:
(1)口语化严重,导致实体歧义消解困难;
(2)短文本上下文语境不丰富,须对上下文语境进行精准理解;
(3)相比英文,中文由于语言自身的特点,在短文本的链指问题上更有挑战。
短文本上下文语境不丰富,平均长度只有22个字符,须充分理解上下文及已知信息,因此在此次比赛中,容联云AI研究院算法团队创新性地提出短文本语义计算框架,设计多轮匹配、验证的模式,实时引入已匹配实体的信息,为句子内多个实体的消歧提供了更丰富的信息,并利用命名实体类别信息辅助实体链接,在此次比赛中拿到榜首。
实体链接能够利用知识库丰富的语义信息,在许多领域发挥非常重要的基础性作用,例如问答系统(question answering)、语义搜索(semantic search)和信息抽取(information extraction)等。
这些任务都需要以文本中提及(mention)确切的、唯一的语义为前置条件,而该参赛系统实际上是从容联云知识图谱问答中实体链接技术方案改造而来的,此次比赛也证明了容联云语义理解、知识图谱、智能问答的基础实力,充分展现了在AI领域的技术积淀和先进性。
知识图谱在人工智能应用中的重要价值日益突显,在先进技术与理论研发的同时,容联云深耕垂直商业场景。容联云研发并积累了面向业务知识图谱敏捷构建与应用的核心算法能力,可快速响应业务需求,并利用“知识”增强现有的语义理解技术,解决用户的知识查询等问题。
真正高效的人工智能的沟通价值在于高效理解用户需求,为用户解决问题、创造企业价值。容联云AI研究院持续深耕并不断取得突破的技术体系是通讯+AI一体化,连接B端客户,和业务场景密切结合,对接更多的行业,应用在企业营销与服务的售前、售中、售后等核心环节,而不仅仅是简单的响应式的服务。”
经过多年通讯与AI的积累,容联云已经进化为通讯+AI一体化的AI能力平台,成为数智化趋势下赋能各行业的新型基础设施。
相关文章
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









