Facebook人工智能研究部门推出聊天机器人BlenderBot2.0

2021-07-22 20:24:59爱云资讯

近几年,随着科技的日益进步,智能移动设备已悄然进入了千家万户,互联网的迅猛发展使其逐渐突破了传统 PC 市场的束缚,向着移动终端急速前进。多终端的互联网大环境下,人们日常工作、生活产生的信息量正以爆炸形式增长。

使用搜索引擎,帮助用户更好地寻找和发现所需要的信息,一直是信息检索领域的研究热点。而面对海量的网络信息时,这种逐条信息先浏览再判断的方式无法满足用户迅速获取最有效信息的需求现状,而这也是传统搜索引擎的不足之处,在这种情况下,自动问答系统应运而生。

目前基于开放域的自动问答系统多采用智能聊天机器人的形式呈现,用户使用自然语言与机器人通过一问一答的方式进行聊天,十分接近普通人类生活中的聊天模式。聊天机器人不仅能回答用户提出的问题,同时还能洞悉用户的需求,一针见血地解决用户的实际问题。


(来源:Pixabay)

近年来,聊天机器人在商业领域尤其是电子商务领域得到了青睐,常见的有虚拟私人助理 Siri,微软小冰、Cortana,Alibaba 聊天机器人,小 i 和小度等。国外在智能聊天方面的研究较多,且起步较早。

众所周知的 Siri 成立于 2007 年,2010 年被 Apple 公司收购,成为民用版软件 Siri 虚拟个人助理,最初以文字聊天服务为主,之后与 Nuance 合作,增加了语音识别功能,搭载在 iPhone 设备上,通过简单易用的对话接口,使用者可以用声音或文字的方式来搜索周边消息,并提供订位、订票等服务。Siri 的背景技术相当强大,充分利用了以 Google 为代表的网页搜索技术、以 Wikipedia 为代表的知识库技术和以 Yelp 为代表的问答及推荐技术等。

国内也有不少智能聊天机器人日益涌现,如小 i,小 Q 和小度等。其中,小 i 于 2001 年研究开发,专注提供智能客服、智能知识库、智能微应用等成熟的解决方案,业务涉及通信、电子政务、智能家居和汽车交通等传统行业。

小度是百度研发的智能信息机器人,它基于百度强大的搜索引擎技术和深度问答技术提供智能交互式的搜索模式,高效满足用户的信息搜索需求,提高搜索效率。

目前国内外对于智能聊天机器人的研究大部分都是基于开放域的知识问答系统,以知识库的训练和搜索为主,针对垂直领域、以陪伴共情的方式进行人机交互的聊天机器人却少之又少,而现代社会发展节奏之快,使得人与人之间的距离越来越遥远,相比冷冰冰的机器,人类更需要一个情感发泄的出口和一个可以信赖的朋友。

图 | 科技的日益进步让人与人之间的距离越来越远(来源:Pixabay)

BlenderBot 2.0 的出现

近日,Facebook 人工智能研究部门在近日推出了聊天机器人的新一代产品,Blenderbot 2.0。他们宣称这是第一个可以同时建立长期记忆的聊天机器人,新一代聊天机器人可以持续访问、搜索互联网以获取最新的信息,并且可以就当前话题和人进行复杂交谈。"这是对初代 BlenderBot 的重大更新,我们的研究人员于 2020 年将其开源,并率先将多种和人对话技能(如机器人的自身性格、自身知识等)整合到一个系统中 ",该研究部门成员说到。他们在产品介绍中说,与前一代产品相比,第二代聊天机器人 Blenderbot 2.0 在与人交谈时更擅长了,表现在和人可进行时间更长且符合事实逻辑的对话。


图 | 人们可以和 Blenderbot 2.0 讨论某个球星的最新消息(资料图)

在和人对话期间,研发小组使用的模型可以生成上下文互联网搜索查询,并读取结果,并在回复人们的问题和评论时整合该信息(意味着模型可以根据世界的变化而发生变化)。

该模型可以获取聊天机器人在和人对话期间收集的相关信息并将其存储在长期记忆中,以便它可以在可能持续数天、数周甚至数月的正在进行的和人对话再次利用到这些信息。同时,和不同的人交谈所存储的信息不同,这可以保证每个人和聊天机器人交谈时所获得的感受是不同的。研究小组发布的 BlenderBot 初代版本的记忆时间非常短,可以称作是 " 鱼的记忆 ",而且所拥有的记忆都是静态的,也就是说这些记忆仅限于所学的内容,无法获得额外的知识(比如 NBA 的麦迪在魔术队效力时推出了第一代聊天机器人,但后面麦迪去了火箭队,第一代聊天机器人是无法实时获取和更新这些信息的)。



图 | 人们可以和 Blenderbot 2.0 讨论某个球星的最新消息(资料图)

同时,研究团队将第一代机器人 BlenderBot 1.0 和第二代机器人 BlenderBot 2.0 进行对比,第二代机器人具有可以访问记忆的能力,同时可以和人进行数天、数周甚至数月的话题聊天,也可以进行多人对话,并增加它所知道和可以谈论的内容,这些都得益于它可通过互联网搜索查询来使用和构建知识体系,比如:正在播放体育节目最新比分、电影或电视节目以及最新评论,某个 NBA 球星的职业生涯是怎么样等实时信息并入和人对话中。

同时,研究人员公开了第二代聊天机器人完整模型、代码和设置,以及两个新的和人对话数据集,这些数据可以利用来用于训练模型,利于其他研究人员推进和人对话式人工智能研究。机器学习模型的当前趋势是专注于训练更大的模型,这需要大量的计算资源。但如果让机器人对整个互联网的信息进行存储是不可能的,所以,研究人员的方法是即时访问互联网的方式。


图 | 人们可以和 Blenderbot 2.0 讨论某个球星的最新消息 (来源:资料图)

为了训练神经网络,研究人员收集训练数据。研究人员还发布了由此产生的会话数据集,称为互联网和多会话聊天向导,其中包括:第一个数据集为 BlenderBot 2.0 提供关于如何生成相关搜索引擎查询的监督,以及根据搜索结果监督相关响应。第二个数据集为聊天机器人提供监督,将新鲜知识存储在长期记忆中,并监督给定这些记忆的相关响应。因此,研究人员可以结合数据集执行多任务训练,这使 BlenderBot 2.0 能够同时使用所有这些技能。研究人员希望研究人员的新聊天机器人建立在其前身的能力之上。BlenderBot 1.0 接受了混合技能谈话任务的培训 —— 利用个性、知识和同理心的展示 —— 并将这三者无缝融合。所以 BlenderBot 2.0 也接受了所有这些资源的训练。

BlenderBot 2.0 的测试

在之前的研究里,研究人员已经证实 BlenderBot 1.0 优于 Meena 和 DialoGPI 等其他聊天机器人。为了新模型,研究人员将其与 BlenderBot 1.0 进行了对比,评估了它在多会话聊天中的长期和人对话性能以及在和人对话中成功运用知识的能力。根据评估人员的研究发现 BlenderBot 2.0 将聊天歧义字句从 9.1% 减少到 3.0%,并且在和人对话中的话题一致性提高了 12%,这些结果表明,新系统的长期记忆模型使其能够在更长的时间内维持更好的和人进行对话。
相关文章
热门文章
头条文章
重点文章
推荐文章
热点文章
关于我们|联系我们|免责声明|会展频道
冀ICP备2022007386号-1 冀公网安备 13108202000871号 爱云资讯 Copyright©2018-2023