追一科技超越微软登顶CoQA ,AI多轮对话理解刷新纪录
2019-09-12 17:06:00AI云资讯1304
AI又一次挑战人类取得新突破,这次是多轮对话阅读理解。
近日,由斯坦福大学发起的对话式问答挑战赛 CoQA (Conversational Question Answering Challenge)中,追一科技 AI Lab团队超越微软团队成为榜单第一,刷新了之前微软等团队创造的CoQA纪录。值得注意的是,团队提交的技术方案中,单模型的各项指标表现首次全面超越人类。

阅读理解是目前语言AI最受关注、进步最快的技术方向,全球有两大顶级比赛最受瞩目,分别是注重一问一答的SQuAD和多轮对话问答的CoQA。相比SQuAD,CoQA比赛重点挑战的是模型在对话过程中回答相互关联问题的能力,而且对话问答数据集由来自不同领域一系列文章中的对话问题组成,答案的形式非常自由,这些改进点都极大地提高了挑战赛的难度。
在此之前,包括微软、科大讯飞、搜狗等知名企业和院校,都曾经登顶榜单,其中微软在组合模型上,一度成为最佳记录保持者,引起业内瞩目。
追一科技团队在大规模预训练模型RoBERTa的基础上,融入了对抗训练(Adversarial training)和知识蒸馏(Knowledge Distillation)的思想,同时兼顾了CoQA数据集的自身特点,实验结果表明,上述方法显著地提升了系统表现。目前,团队在2019年9月5日提交的RoBERTa + AT + KD系统,在CoQA榜位列第一,其中单模型(single model)的表现首次全面超越人工评测指标。
此次登顶CoQA,也是追一科技持续耕耘AI技术的成果之一。作为以技术创新为核心驱动力的AI公司,追一科技一直专注在前沿AI语义交互与算法技术的攻坚,在意图识别、情感分析、知识图谱、阅读理解、多轮对话等领域不断取得突破。并获得了2018 CMRC机器阅读理解比赛冠军、2019年CCF语言与智能技术竞赛的“知识驱动对话”冠军。
除了技术突破,追一科技一直坚持研发与应用互相驱动,规模化落地AI应用。追一科技的智能产品和解决方案,已经在金融、运营商、政企、泛互联网等众多领域落地,服务300多家行业标杆客户。与此同时,追一科技还致力于创新型技术的应用落地、量产及标准化,例如,阅读理解、多模态交互数字人等技术和产品,已经在部分券商、银行伙伴场景中应用,实现业内突破。
随着NLP等AI技术的突破,产业智能化时代的到来,多行业场景化需求将对技术创新和产品化能力提出更多挑战。追一科技将继续专注创新能力,攻坚技术前沿,以技术创新赋能更多行业伙伴!
相关文章
- 对话式AI将迈向多模态交互,追一科技成为核心供应商
- 追一科技助力国联证券打造智能服务
- 追一科技智能对话和外呼机器人助力招商证券服务升级
- 追一科技多模态智能服务应用入选AIIA优秀案例
- AI让热线真正“热”起来,追一科技助力12345热线智能化运营
- 追一科技荣获机器之心最佳AI公司TOP 30等三项大奖
- 产学研协同,追一科技与IDEA合作研究NLP大模型
- AI+税务融合,追一科技数字人助力大连税务服务升级
- AI数字员工赋能保险业, 追一科技荣获“最值得信赖智能保险科技领导者”大奖
- 通晓事务的专家型机器人,追一科技事务图谱助力智能化升级
- 追一科技亮相世界人工智能大会,智能交互和分析助力千行百业
- 语音应用技术创新奖! 追一科技在中国零售金融创新实践评选中摘得大奖
- 业务菜鸟如何成长为销售老司机?追一科技用AI开启保险销售培训新模式
- 深圳战略新兴产业拟资助项目公布:追一科技虚拟数字人入选
- 追一科技获得2020语言与智能技术竞赛关系抽取任务冠军
- 追一科技获得《亚洲银行家》、IDC等机构金融大奖
人工智能企业
更多>>人工智能硬件
更多>>- 一飞智控携全空间解决方案及三款新品,亮相2026世界无人机大会
- 续航超强的微星全新尊爵系列,重塑轻薄本的超凡全能体验
- BOE(京东方)全球首发原生千帧FHD 护眼电竞显示器 真千帧硬实力引领电竞高刷新时代
- Neousys宸曜发布星宸系列强固嵌入式工控机,赋能工业智能升级
- BOE(京东方)OLED技术赋能联想YOGA Air 14 Ultra 定义超轻薄AI PC新标杆
- iQOO 15T正式发布:天玑9500 Monster版加持 全能体验无短板
- 从“+AI”到“AI+”:天禧AI 4.0加持,联想AI主机领衔L3级终端震撼登场
- 拾年匠音,声来不凡,致敬1000X系列十周年 索尼发布1000X十周年典藏版头戴降噪耳机
人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









