效果、性能双突破!快手OneSug端到端生成式框架入选AAAI 2026
2026-01-22 17:05:15AI云资讯1440
当你在电商平台搜索“苹果”,系统会推荐“水果”还是“手机”?或者直接跳到某个品牌旗舰店?短短一个词,背后承载了完全不同的购买意图。而推荐是否精准,直接影响用户的搜索体验,也影响平台的转化效率。
基于上述问题,快手在业界首次提出端到端的生成式统一查询推荐框架——OneSug,成功将召回、粗排、精排等多个阶段统一在一个生成模型中,显著提升了推荐效果与系统效率,在快手电商场景中实现了业务指标与用户体验的双重提升。
本工作相关成果《OneSug: The Unified End-to-End Generative Framework for E-commerce Query Suggestion》已被人工智能顶级会议 AAAI 2026 接收。

查询推荐(Query Suggestion)是现代电商搜索系统中的关键功能,通过在用户输入过程中实时推荐相关查询,帮助用户快速明确意图,提升搜索体验与转化效率。传统方法通常采用多阶段级联架构(MCA),虽然在效率与效果之间取得了一定平衡,但由于各阶段目标不一致、长尾查询召回困难等问题,限制了系统性能的进一步突破。
而近年来,生成式检索(Generative Retrieval)因其强大的语义理解与生成能力,在推荐与搜索领域展现出巨大潜力。然而,现有方法多聚焦于视频推荐,其本质上是一个开集到开集的任务,难以直接应用于输入输出都是开放词表的的查询推荐场景。
针对上述问题,快手提出的 OneSug 模型主要包括3个部分:
首先是 Prefix-Query表征增强模块。Sug场景下,用户输入的前缀往往较短且意图模糊(如“苹果”可指水果或品牌)。为此,快手提出的解决方式分为语义与业务空间对齐、层次化语义ID生成2个部分。
其次是统一的Enc-Dec生成架构。OneSug 的生成架构基于Enc-Dec结构,并直接通过自回归(Autoregressive)方式生成用户最有可能点击的Query。
此外,借助用户行为偏好对齐(RWR)的方式,通过用户偏好量化、混合排序框架奖励加权偏好优化、混合排序框架的方法,分别对用户在搜索场景下的真实行为进行了精细化分级。RWR 的核心思想是根据正负样本之间的奖励差距,让模型学习到用户对不同query的个性化偏好。
总体而言,OneSug 是业界首个在电商场景中实现全流量部署的端到端生成式Query推荐系统,其统一建模方式显著提升了语义理解与个性化推荐的能力,为生成式模型在搜广推的落地提供了新范式。
未来,我们将进一步探索大语言模型在排序阶段的强化学习优化、实时更新等方向,持续推动端到端生成式系统在推荐、广告等多业务场景中的广泛应用。
相关文章
- 快手全新「检索数据引擎」CroPS 入选AAAI 2026 Oral
- 快手直播平台被黑灰产入侵,企业内网暴露的风险有多大?
- 让搜索更懂你 快手自研UniDex与UniSearch实现新一代工业级搜索
- 快手发布EMER框架,“自进化”AI重塑短视频推荐模式
- 登顶SWE-Bench,快手KAT-Dev-72B-Exp刷新开源SOTA
- 神眸荣获快手“品牌标杆奖”,以芯片级创新跻身行业前列
- 快手发布多模态大模型Keye-VL-1.5 8B性能领先、视频理解能力更强
- 累计生成超2亿视频,快手可灵AI引领“生成式AI应用元年”
- CVPR2025:快手可灵四大技术方向布局视频生成及世界模型
- 快手上线鸿蒙应用高性能解决方案 高效提升数据反序列化性能
- 快手与杜比实验室达成深度合作 短视频领域首家全链路支持“杜比视界”
- 快手与清华大学联合项目荣获钱伟长中文信息处理科学技术奖
- 人工智能智库网络在京启动,百度、快手、华为、蚂蚁、腾讯、阿里等发起
- 快手可灵AI面向全球发布1.5模型 新增“运动笔刷”效果业内领先
- 蓝色光标Blue AI携手快手可灵AI,共同引领AI视频生成新时代
- 快手出席2024中国多媒体大会:AI驱动多媒体创新 构建AI产学研生态









