任务驱动的多轮对话的设计参考.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
. 1.1 背景知识介绍 多轮对话之所以称之为多轮对话, 而不是多轮问答, 是因为除了问答内容外, 还有闲聊模式 下的情感交流, 以及多数情况以陈述句形式表达的情景模式, 因此多轮问答实际是多轮对话 的子集。 由于事件的复杂性直接导致了多轮对话的复杂性, 即上文所述的正常的知识问答和 命令问答外,还有情感和场景表述,造成每一句与上下文语义高度相关或不相关交错出现, 就导致了规则的高度复杂性。 如果用有限状态机来处理多轮对话,就必须对话语权方(即谁说出的话,必须被对方回答, 则这方为对话话语权方)的每一个 token 语句进行意图识别,引入意图队列,对队列进行 基于规则的推理机处理或基于深度学习的预测, 例如: (寒暄 查订单 确认退款 ? ) 正常情况 ? == 再见结束本轮对话。 Word 专业资料 . 当然也可以用 seq2seq 的方法,将整个对话过程,抽象成一个 session 。输入若干个相关 句子,解码成一个句子,即答案。 多轮交互的一个重点问题是: 如何根据上下文理解当前的意图, 而不仅仅是针对单轮进行一 个分析,从而能够使得对话在一个连续的语境下,是具备 session 粒度理解能力的。 以下方案,均假设有一个已经做得比较好的单轮理解以后的情况: 尝试方案 1 : 最简单粗暴地,把多轮 query ,融合成一个单轮的 query ,进行一次性的解析 . 直接将多轮交互的意图理解问题, 转换成一个单轮的意图理解问题, 从而复用原有的单轮理 解效果。 例如:我想看电影 -- 周星驰演的 -- 喜剧片,三个 query 合并以后,解析到实际用户的需求, 是周星驰主演的喜剧电影。 优点:简单,粗暴,易于实现,几乎服用了单轮解析能力 缺点:简单,粗暴,易于出错,几乎没有任何实质性的多轮解析能力,纯粹靠运气 优化方向:可以加入一些 query 拼接的限制,提高拼接的准确率,从而在运用到单轮解析 能力的同时,不至于在准召上偏离得太离谱(如:只拼接两轮的、三轮及以上拼接,考虑拼 接后的意图变化情况等) Word 专业资料 . 尝试方案 2 : 不是简单拼接,而是结果和 query 的识别过程拼接: 单轮已经解析出了一个意图和某些槽位,将此意图及槽位存储起来。 遇到 query 的时候,判定该意图下,这个 query 能否纳入同样的意图中,抽取出对应的槽 位。 如果可以,则更新意图的槽位内容。 如果不可以,则抛弃当前意图,以 query 作为单轮解析,得到新的意图。 例如: 我想看电影 -- 要免费的, 第一轮意图为电影, 第二轮在电影这个意图下, 发现 “免费” 这个槽位,是符合电影意图描述的,所以,为该意图的槽位新增一个“免费” 例如:我想看爱情电影 -- 能给我讲个笑话吗,第一轮意图为电影,而第二轮在电影这个意图 下,发现 query 并没有任何跟电影相关的槽位信息,所以,抛弃第一轮的电影意图,直接 将第二轮 query 当成单轮的,直接解析得到新的意图 -- 笑话。 优点:基于意图来进行判定,比拼接更准确,也更广泛地识别当前 query 是否仍在同一个 意图中, 递归地实现多轮意图解析, 避免了拼接过长, 拼接过于粗暴带来的误召回和欠召回 Word 专业资料

文档评论(0)

tianya189 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地上海
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档