SIGIR 2019国际信息检索大会公布结果 深兰科技获高精度召回任务挑战赛冠军
2019-07-29 15:07:52AI云资讯959
日前,信息检索领域的顶级国际会议SIGIR在法国巴黎成功举办,深兰科技再夺一冠!在SIGIR2019电子商务研讨会中,DeepBuleAI团队荣获高精度召回任务挑战赛第一名。

SIGIR(ACM International Conference on Research and Development in Information Retrieval)国际计算机协会信息检索大会是一个展示信息检索领域中各种新技术和新成果的重要国际论坛,专注于信息存储、检索和传播的各个方面,包括研究战略、输出方案和系统评估等。国际信息检索大会的历史可以追溯到1971年,当年召开了ACM SIGIR 的信息存储和检索研讨会。而第一次正式的SIGIR 大会于1978年在美国纽约州的罗彻斯特召开,每三年在美国以外举办一次,2019年落地法国巴黎。亚马逊、eBay、 Google等电商及搜索引擎国际巨头,历年来均深度参与了SIGIR。

SIGIR2019电子商务研讨会聚焦信息检索和自然语言处理研究及其在电子商务领域的应用,并具体讨论了在电子商务领域中产品搜索和推荐的方法。而其重头戏,则是由eBay组织的“高精度召回任务”数据挑战赛,吸引了多个来自全球近20个团队参赛。

本次挑战赛针对的是电子商务搜索中的常见问题:标识使用非相关性排序时要显示的内容。比赛数据集包括大约90万条来自eBay收藏类别中的特定字段,以及与收藏类别相关的150个热门搜索查询关键词,每条数据带有商品标题、价格、分类目录和相应图像网址的URL。参赛选手要合理运用数据集,来判断查询短语和文档是否相关。
通常,用户在电商平台搜索的结果是按维度而非相关性进行排序的,例如流行度、评论得分、价格、距离等,这与传统的、面向信息的搜索有诸多差异。在这种搜索中,文档以相关顺序出现,许多搜索方法都利用了这一点,但非相关性排序顺序的研究则较少。而本次挑战赛的重点在正是使用非相关性排序时找到应该召回的内容,这是一个相当困难的问题,包括典型的搜索挑战,如歧义,多重查询意图等。
深兰科技DeepBuleAI团队基于挑战赛数据集构造了一些有意义的手工特征,并在实践效果较好的文本相似度计算模型ESIM的基础上,叠加了门限机制,设计生成了的Gate-ESIM网络。同时团队还基于训练集采用10折交叉验证,结合多种子平均来搜索得到每个搜索关键词的的标签划分阈值。结果证明,这套方案大大提高了用户非相关性搜索的匹配指标,在Ave-F1指标上取得了非常好的效果。该方案不仅可以应用在电子商务的召回任务中,也可以应用在智能客服,文章推荐等需要做文本匹配的场景中。
DeepBlueAI团队坦言,每次竞赛都是验证深兰科技基础算法和技术实力的机会,该模型也将被用于深兰科技的quiXmart快猫智能零售平台,提高搜索场景的匹配率。深兰科技始终致力于基础研究和应用开发双落地,数据挖掘分析作为最底层的技术之一,对后期的应用起着至关重要的作用。通过不断改进和完善,这些技术有望在深兰科技的产品和方案上得以应用,更多地服务于民生。
相关文章
人工智能企业
更多>>人工智能硬件
更多>>- 一飞智控携全空间解决方案及三款新品,亮相2026世界无人机大会
- 续航超强的微星全新尊爵系列,重塑轻薄本的超凡全能体验
- BOE(京东方)全球首发原生千帧FHD 护眼电竞显示器 真千帧硬实力引领电竞高刷新时代
- Neousys宸曜发布星宸系列强固嵌入式工控机,赋能工业智能升级
- BOE(京东方)OLED技术赋能联想YOGA Air 14 Ultra 定义超轻薄AI PC新标杆
- iQOO 15T正式发布:天玑9500 Monster版加持 全能体验无短板
- 从“+AI”到“AI+”:天禧AI 4.0加持,联想AI主机领衔L3级终端震撼登场
- 拾年匠音,声来不凡,致敬1000X系列十周年 索尼发布1000X十周年典藏版头戴降噪耳机
人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









