第一句子大全,网罗天下好句子,好文章尽在本站!

ACL 2019论文分享:自我进化的对话机器人

时间:2011-11-29

摘要现有的基于监督学习的对话系统,缺乏对多轮回复方向的控制和规划,导致对话中发生重复、发散等问题,使得用户的交互体验较差

友情提示:本文共有 1602 个字,阅读大概需要 4 分钟。

ACL 2019 收录论文分享:《Know More about Each Other: Evolving Dialogue Strategy via Compound Assessment》。

摘要

现有的基于监督学习的对话系统,缺乏对多轮回复方向的控制和规划,导致对话中发生重复、发散等问题,使得用户的交互体验较差。在本文中,我们对多轮对话进行了复合评估(compound assessment),并基于该评估利用强化学习优化两个自对话(self-play) 的机器人,促进生成过程中较好地控制多轮对话的方向。

考虑到对话的一个主要动机是进行有效的信息交换,针对PersonaChat 问题(两个人相互对话聊兴趣爱好),我们设计了一个较为完善的评估系统,包括对话的信息量和连贯度两个主要方面。我们利用复合评估作为反馈目标(reward),基于策略梯度算法(policy gradient),指导优化两个同构的对话生成机器人之间的对话策略(dialogue strategy)。该对话策略通过控制知识的选择来主导对话的流向。在公开数据集上进行了全面的实验,结果验证了此方法生成的多轮对话质量,显著超过其他方法。

1、引言

最近几年,越来越多的智能对话系统开始走进大家的生活,比如闲聊型的小冰、任务型的Echo等。这些对话系统可以模仿人与人的交互,生成一些流畅的句子,但是这些系统通常忽视了人与人聊天的内在原因:信息交换和社交关系增强。现实中,每个人都有自己的人设或背景信息,比如“热爱滑雪”、“喜欢看权力的游戏”等。因此,我们提出了一个切实的对话目标:让双方在对话中彼此了解更多。我们利用两个对话机器人来模拟两个人的对话,让他们在通顺自然的聊天中,增进对于彼此人设的了解。

2、模型介绍

我们设计了一个新的生成-评估框架进行多轮对话,如图1所示。在已部署的知识选择策略下,两个对话机器人根据它们的背景信息相互介绍自己,并对双方的句子做出合适的回应。它们产生的对话和相应的背景信息,被送到策略评估端进行评估,包括信息量和连贯性等方面。这些评估被整合成复合反馈指标(compound reward),作为强化信号指导对话策略持续进化。

图2是具体对话生成的网络架构图。由上文(context) 和背景知识(knowledge) 作为输入,我们的对话策略可以选择一条合适的知识Zi来产生有信息且连贯的回复。

从图中可以看出,产生高质量的回复,关键在于合适知识的选择(图2中蓝色部分),这部分会在生成-评估强化学习框架下,基于策略梯度算法持续进化。

3、实验结果及分析

在公开数据集PersonaChat上,我们进行了全面的实验验证和分析。如表1所示,在自动指标上,包括回复多样性和知识利用上,此方法显著优于其他方法。

如表2所示,在人工评估上,包括整体得分、知识覆盖率、简洁度和连贯性指标上,此方法也显著优于其他方法。

在表3中,我们给出了由每个方法生成的仿真对话的具体case。可以看出,此方法可以产生有信息且连贯的对话。

4、结论

为了产生有信息且连贯的多轮对话,本文提出了一个新的生成-评估框架。两个对话机器人模拟人类产生自然的对话,并根据评估端提供的打分,不断进化它们的对话策略,以彼此了解更多。实验验证了此方法在自动指标和人工评估上,都显著优于其他方法。

本篇论文可在百度学术搜索下载。

至此,《Know More about Each Other: Evolving Dialogue Strategy via Compound Assessment》论文的分享到此结束,敬请期待2019百度被ACL收录的其他论文。

百度自然语言处理(Natural Language Processing,NLP)以『理解语言,拥有智能,改变世界』为使命,研发自然语言处理核心技术,打造领先的技术平台和创新产品,服务全球用户,让复杂的世界更简单。

本文如果对你有帮助,请点赞收藏《ACL 2019论文分享:自我进化的对话机器人》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
继CVPR AAAI大丰收后 百度又有11篇论文被ACL 2020录用

继CVPR AAAI大丰收后 百度又有11篇论文被ACL 2020录用

...l with Discrete Latent Variable研发开放领域(Open-Domain)的对话机器人,使得它能用自然语言与人自由地交流,一直是自然语言处理领域的终极目标之一。对话系统的挑战非常多,其中有两点非常重要,一是大规模开放域多轮对话数据...

2011-10-01 #经典句子

ACL 2020论文分享|基于对话图谱的开放域多轮对话策略学习

ACL 2020论文分享|基于对话图谱的开放域多轮对话策略学习

...更多自然语言处理技术干货!本文对百度NLP入选ACL 2020的论文《Conversational Graph Grounded Policy Learning for Open-Domain Conversation Generation》进行解读,该论文提出用图的形式捕捉对话转移规律作为先验信息,用于辅助开放域多轮对话策略...

2023-07-10 #经典句子

AI顶会ACL 2021放榜:网易伏羲三篇论文入选

AI顶会ACL 2021放榜:网易伏羲三篇论文入选

...Annual Meeting of the Association for Computational Linguistics)公布了论文录用结果。网易伏羲共有三项研究被本届ACL收录,内容包括自然语言生成、无监督文本表示学习等方向,相关技术已应用于游戏、文创及智慧文旅等行业。ACL由国际计...

2023-12-03 #经典句子

ACL 2019 论文:谷歌提出增强神经网络机器翻译鲁棒性的新方法

ACL 2019 论文:谷歌提出增强神经网络机器翻译鲁棒性的新方法

...,从而导致各种不同的错误。谷歌研究院的一篇 ACL 2019 论文提出了一种方法,使用生成的对抗性样本来提高机器翻译模型的鲁棒性,防止输入中存在的细小扰动度对其造成影响。结果表明,该方法提高了 NMT 模型在标准基准上的...

2023-10-11 #经典句子

ACL 2019最佳论文出炉:华人团队包揽最佳长短论文一作

ACL 2019最佳论文出炉:华人团队包揽最佳长短论文一作

... 边策 发自 凹非寺量子位 出品 | 公众号 QbitAIACL 2019最佳论文新鲜出炉了。刚刚,自然语言处理领域的顶会ACL 2019公布最佳论文,本次共颁布了4个奖项,共有8个获奖名额,分别是:最佳长论文最佳短论文最佳DEMO论文5篇杰出论文...

2023-07-25 #经典句子

中科院 华为等斩获最佳长论文 ACL 2019奖项全部揭晓

中科院 华为等斩获最佳长论文 ACL 2019奖项全部揭晓

...利佛罗伦萨开幕。不久之前,ACL 2019 官方网站公布了入围论文奖项的 32 篇候选论文。刚刚,ACL 2019 最终获奖论文公布,多所国内高校及众多华人学者获得荣誉。值得一提的是,来自中科院、华为诺亚方舟实验室等机构的论文获...

2008-01-04 #经典句子

创新工场两篇论文入选ACL 2020 将中文分词数据刷至新高

创新工场两篇论文入选ACL 2020 将中文分词数据刷至新高

...人振奋的是,来自创新工场大湾区人工智能研究院的两篇论文入选。这两篇论文均聚焦中文分词领域,是深度学习引入知识后的有益尝试,将该领域近年来广泛使用的各数据集上的分数全部刷至新高,在工业中也有着可观的应用...

2023-11-28 #经典句子

ACL 2019年度回顾:自然语言处理发展趋势

ACL 2019年度回顾:自然语言处理发展趋势

...的会议之一,ACL 2019的规模也再破新高,共接收到2900多份论文,比2018年增加75%!在今年的会议中,NLP应用全面开花,而以BERT为代表的NLP预训练技术也不出意料地抢尽风头。除此之外,NLP技术可解释性和评判体系等更为基础的...

2023-10-26 #经典句子