亚马逊研究人员训练AI重写查询以更好地理解口语
2020-03-18 12:11:00AI云资讯791
听说过查询重写吗?这是一种用于减轻口语理解(SLU)管道中的错误的技术,例如支持Amazon的Alexa,Google Assistant,Apple的Siri和其他语音助手的管道。许多SLU系统分为两个部分:负责将音频转换为文本的自动语音识别(ASR)系统,以及从结果摘要中提取含义的自然语言理解组件(NLU),而且每个问题都会带来错误(例如,由于背景噪音和说话者口音造成的文字识别错误)会累积并引起会话摩擦。

幸运的是,查询重写已在生产系统中显示出令人鼓舞的结果;它需要记录本并重写,然后再将其发送到下游NLU系统。这可能就是为什么Drexel大学和Amazon的研究人员在预印本纸上研究了一种方法,该方法使用AI用重新构造的查询代替原始查询。
团队的系统使用经过训练的模型来从查询中捕获潜在的句法和语义信息,从而选择最相关的候选项作为查询的重写。给定输入查询,嵌入器模块通过将查询输入预先训练的上下文词模型中来提取表示形式。然后将该表示形式合并为查询级别的数学表示形式(嵌入),此时将使用一种机制来测量两个查询的相似性。数百万索引的原始查询和重写来自从Alexa的历史数据中选择的一组预定义的高精度重写对,而最相关的是由系统按需检索。
研究人员指出:“ SLU系统中的NLU组件为查询提供了半结构化的语义表示,其中可以通过相同的NLU假设将各种文本形式但具有相同语义的查询组合在一起。”“例如,'请您播放想象中的巨龙','打开想象中的巨龙'[和]'播放想象中的巨龙的歌曲'具有相同的语义和相同的NLU假设,但是它们的文字不同。直观地讲,使用噪声较小的NLU假设来扩充查询文本可能会有所帮助。”
为了训练该系统,该团队构建了两个数据集:一个用于预训练话语嵌入,另一个用于微调预训练的模型。预训练集包括1100万个会话,涉及约3000万话语,而微调集(使用现有的重新短语检测模型管道生成)具有220万对话语。
研究人员通过在16,000对带注释的测试集中,将检索到的重写候选的NLU假设与实际的NLU假设进行比较,从而评估了查询重写性能。对于每个给定的查询,他们检索了前20个重写,并且使用重写的NLU假设通过标准信息检索指标来测量系统性能。
该团队报告说,预训练不仅显着减少了对高质量查询检索训练对的需求,而且“显着”提高了性能。他们写道:“尽管我们在本文中专注于QR任务的预训练,但我们认为类似的策略可能会应用于NLU中的其他任务,” [例如]域分类。
相关文章
- 全球首创双目技术加持,MOVA ViAX登顶亚马逊智能割草机销量榜首
- OpenAI宣布获得亚马逊、英伟达和软银新融资1100亿美元
- 亚马逊广告发布2026年全球营销趋势洞察
- 亚马逊海外购「马上有折」年货节正当时,新春五重奏温暖上线
- 从亚马逊货架到全球心智货架:钛动科技助力智能家电品牌破圈
- 亚马逊数据中心将采购利用微生物从矿石中浸取的金属铜
- 亚马逊FBA的“武力值”,拉满了
- 在亚马逊卖挖掘机的卖家,找到了流量密码
- 金牌护航 智领出海——拓威天海亮相2025亚马逊全球开店跨境峰会,以定制化服务引爆跨境物流热潮
- 涂鸦智能荣膺亚马逊云科技2025年合作伙伴奖项
- 伊克罗德信息蝉联2025亚马逊云科技中国区年度创新合作伙伴奖,以AI深耕云端未来
- 聚焦亚马逊峰会:获官方推荐合作伙伴PartnerBoost,展位洽谈热度持续攀升
- 亚马逊要求Perplexity停止用AI浏览器智能体为用户代购商品
- OpenAI与亚马逊达成380亿美元AI训练合作协议
- 受人工智能技术的影响,亚马逊宣布裁撤14000个工作岗位
- 奈飞、亚马逊和苹果均有意收购华纳兄弟
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









