第一句子大全,网罗天下好句子,好文章尽在本站!

DSTC10 放榜 百度 PLATO 勇夺知识型任务口语对话赛道双冠军!

时间:2022-11-30

作为全球人工智能顶级学术竞赛之一,DSTC比赛持续受到国内外知名企业和机构关注

友情提示:本文共有 2141 个字,阅读大概需要 5 分钟。

近日,第十届对话系统技术挑战赛DSTC10落下帷幕。作为全球人工智能顶级学术竞赛之一,DSTC比赛持续受到国内外知名企业和机构关注。百度在DSTC10中斩获了知识型任务口语对话赛道两项任务的全部冠军,并以大幅优势领先对手。

在上一届DSTC 比赛中,百度PLATO-2 模型夺得多个任务冠军;本次比赛,百度结合了最新发布的全球首个百亿参数对话生成模型PLATO-XL,在赛题难度加大的情况下,凭借强大的技术实力再次拿下多个冠军。

加入错误干扰数据 知识型任务口语赛道难度空前

任务型对话基于知识为用户提供口语化的信息查询、指令执行等智能服务。今年DSTC的知识型任务口语对话赛道由对话状态追踪和知识对话两项核心子任务构成,这两项任务是判断对话系统能否在多轮对话中准确理解用户意图、正确传递信息的关键。为了更接近真实场景,该赛道首次在竞赛中使用了带有自动语音识别(Automatic Speech Recognition, ASR)错误干扰的口语对话数据。下图展示了验证集中的一个对话片段,口语的表述更加复杂多样,且 ASR 错误带来的干扰很大(作为参考,灰色部分为人工再次核查录音,校正后的对话内容)。相比于传统对话系统中采用的众包数据,该赛道不仅训练数据缺乏,而且数据噪音大,这对正确理解用户信息并保持高质量的回复是一项极大的挑战。

知识型任务口语对话赛道ASR错误示例:灰色字体为专家根据对话内容的准确文本。红色字体为ASR错误内容

那么在激烈的竞争中,百度是如何在这一赛道拿下两项任务全部冠军的呢?

对话状态追踪任务大幅领先 创新提出多层级数据增强框架

在任务1对话状态追踪任务中,参赛系统需要完成多领域对话状态追踪,正确识别出用户意图和槽位。首先,针对训练数据匮乏的难题,百度团队创新地提出了多层级数据增强方法,通过对已有对话进行实体替换、基于对话动作随机游走、口语模拟增强等技术,自动构造了数十万的多轮口语对话。然后,依托对话生成预训练模型PLATO,进行对话追踪任务端到端建模,即根据多轮对话上文自动生成意图和槽位,大幅提升模型鲁棒性。最终联合目标准确率(Joint Goal Accuracy)达到 0.4616,超越第二名十个百分点,以绝对的优势夺得第一。

对话状态追踪任务示例:将用户的口语文本转为结构化的对话状态描述同时,还需要修复相关ASR错误

对话状态追踪任务榜单(前五名), A11为百度团队。

知识对话任务夺冠 实体增强辅助知识精准定位

第二项任务为知识对话。传统任务型对话以知识为基本支撑,一旦用户的诉求超出知识范畴,对话系统就无法做出正确的回复。针对该问题,通常会在对话系统中引入大量的外部知识,来进一步提升对话系统的能力。在该背景下,第二项任务设置了三个级联的子任务:

判断当前对话是否需要使用外部知识;选择跟当前对话内容匹配的知识;根据选取的知识进行回复生成。针对这些子任务,百度创新地提出了知识增强的对话策略:首先,在多领域任务对话的复杂场景下,准确识别与对话意图相关的知识需求;然后,知识召回模型从大规模知识库中高效召回合适的知识;最后,利用PLATO-XL的灵活可扩展性,基于对话上下文内容以及召回的外部知识,自动生成回复。从系统回复的人工评估结果来看,百度在回复的准确性和合适性两个指标都取得最好成绩。

值得一提的是,任务结果评估也引入了人工标注的结果(Ground-truth)。百度提交的结果与人工标注结果差距最小(百度系统得分 3.4235 vs 人工标注结果得分 3.5291),验证了上述知识增强的对话策略更接近人的认知过程,相比于其他系统,具有更好的可解释性。

如同人在回答一些不了解的专业问题也需要查阅资料,知识增强的方法使对话系统具备了“临时查阅”的能力,能够更加专业、更加精准地回答问题。知识增强的对话不仅成功应用于知识对话任务,在百度近期发布的PLATO-KAG等相关的工作上也取得了。可以说,知识增强已经成为对话系统的必备能力。

知识对话任务示例:系统需要判断是否需要引入外部知识库,并利用外部知识(External Knowledge)来准确响应用户需求

知识对话任务榜单(前五名),B10为百度团队。第一行(Ground Truth)为人类标注。对话从准确性(Accuracy), 合适性(Appropriatenesss)两个角度进行评估。

对话系统是自然语言处理领域最具挑战性的技术之一,尤其是实际应用场景下,数据高噪声、多歧义,比学术研究数据更复杂、更具挑战性。通过此次DSTC10竞赛,百度再次锤炼了PLATO模型的鲁棒性,同时验证了知识增强策略的应用效果,并为解决产业应用中的实际问题提供了全新思路。未来,百度AI还将持续技术创新与突破,实现让对话更有知识、有情感、有逻辑的目标。

百度 PLATO 系列模型完全基于百度自主研发的深度学习平台飞桨。DSTC10的冠军解决方案也会陆续开源到 GitHub,对智能对话感兴趣的小伙伴千万别错过。同时,百度也推出了”百度PLATO”的微信公众号,大家可以体验基于PLATO的中文对话效果。

GitHub 链接:https://github.com/PaddlePaddle/Knover

— 完 —

本文如果对你有帮助,请点赞收藏《DSTC10 放榜 百度 PLATO 勇夺知识型任务口语对话赛道双冠军!》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
课堂指令语的定义

课堂指令语的定义

...为,指挥学生去完成某些特定任务。Searle给教师课堂指令语的定义是:教师课堂指令语是一种言语行为,它能让听话人发生某种行为。在课堂教学过程中,教师课堂指令语是一种指导学生做某事,完成某个动作的语言,具有一定...

2023-05-16 #经典句子

日语敬语|尊敬语的用法总结

日语敬语|尊敬语的用法总结

最近,许多学习日语的小伙伴跟言吉君诉苦——日语中的敬语也太难学了吧!的确,学习日语敬语不仅让许多外国人感到崩溃,就连本土的日本人也时常会出错。众所周知,日本人会根据说话对象的年龄大小、社会地位、职业职...

2023-05-03 #经典句子

搞定日语语分类 让日语学习更简单

搞定日语语分类 让日语学习更简单

...我们已经学习多年的另一个外语——英语,一般来说,英语的常见句型有这5种:主语+谓语、主语+系动词+表语、主语+谓语+宾语、主语+谓语+间接宾语+直接宾语、主语+谓语+宾语+补语。在日语中,句子中的每个单词也都扮演着各...

2022-12-17 #经典句子

2020年1月昆明市五华区三年级英语试卷考点分析

2020年1月昆明市五华区三年级英语试卷考点分析

...并回答动物的名称,食物、饮料单词及进餐相关的交际用语的考查,分数占比都比较大,同时每个区对于颜色单词、问候他人及介绍朋友的交际用语,1-10数字和年龄相关的交际用语的考查,占比较小。下面我们将针对各个区具...

2023-05-13 #经典句子

谈论我国本土广告语与民族特色

谈论我国本土广告语与民族特色

内容择要:告白语是告白作品中的主要要素,告白语的创作与转达都遭到文明语境的限制,差别国家、差别时代的告白语表示出差别的文明特性。文章指出,我国外乡告白语的内容表示了我国的文明价直观,告白语的艺术方法富...

2013-02-14 #经典句子

能用“吹哨”来对话?在山谷中回荡的哨音如同鸟鸣的西班牙哨语!

能用“吹哨”来对话?在山谷中回荡的哨音如同鸟鸣的西班牙哨语!

...语回复他,声音既嘹亮又清晰;但随着时代演进,不懂哨语的人越来越多,这样的打招呼方式,也就渐渐无法被理解,或者被响应了。传递信息的替代方案而哨语之所以会被发明,其实是岛屿上的地形使然。在戈梅拉岛上,高山...

2023-05-19 #经典句子

高三英语备考该如何努力?要抓住知识的重点 把握关键难点

高三英语备考该如何努力?要抓住知识的重点 把握关键难点

...的关系。动名词的关键知识:动名词作宾语同不定式作宾语的区别。必须用不定式作宾语或必须用动名词作宾语的动词各有哪些?哪些动词用不定式作宾语和用动名词作宾语的意义不同?宾语从句的关键知识:连接词、时态呼应...

2023-10-20 #经典句子

全面解析宾语补足语

全面解析宾语补足语

在英语学习中,我们对于英语的主干充分相对熟悉,但对于支干成分了解的不够深入。那么宾语补足语,作为一种补充成分,它有特点和用法呢?让我们一起进行探讨吧!整体理解宾语补足语:在英语句子中,某些及物动词或介...

2023-08-01 #经典句子

日 韩 越南语为什么这么像汉语?这其实是汉文化“入侵”的结果

日 韩 越南语为什么这么像汉语?这其实是汉文化“入侵”的结果

...来的自豪感、自信感,让一些网民认为,日语、韩语是汉语的后代。因为日、韩两国的一些文字俨然就是汉字,或者发音与汉语相近。特别是日语的发音与我国闽南语的发音,许多都极其相似。其实不用说闽南语,日语的一些词...

2023-06-01 #经典句子