- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于人机对话系统思考
关于人机对话系统思考
摘要:提出了一系列非常重要、影响人机对话质量的问题,包括:如何面向自然语言理解(NLU)构建对话任务分析、深度推理,如何利用语言学尤其是互动语言学研究成果构建对话管理(DM),如何有效建模人机对话中不同任务间的关联约束来发展联合模型等。认为尽管人机对话系统的基础模型已取得了长足进步,但如果不能有效地解决上述问题,就不可能获得高质量的人机对话系统,自然语言处理的水平也就难以得到实质性提升。
关键词: 人机对话系统;NLU;DM;自然语言生成(NLG)
人类社会的一个主要特征是人际交流,广泛深入的人际交流是促进合作,推动社会向前发展的重要动力。人际交流的主要工具是包括汉语、英语在内的各种自然语言,基于自然语言的对话是人际交流的主要方式之一。基于自然语言的对话也称为会话,可以是在两人之间进行,也可以在多人之间进行。此外,自说自话的独白也常被语言学家归入会话。
近年来,随着技术日新月异的发展,各种人造机器成为人类的亲密伙伴,人与机器的交流变得越来越重要。为了与机器交流,让机器明白人类需要它们做什么,人类发明了很多种机器语言。开始,这些机器语言只是少数人使用,随着机器进入到普通人的日常社会生活,就需要机器能与普通人进行交流,发明越来越简单的机器语言或操作方式是一个途径,而让机器能懂得人类语言无疑是一个更自然、更令人向往的方式。人机对话系统旨在实现这种方式,满足普通人与机器进行顺畅交互的需求。
人机对话系统经历了50多年的发展,取得了不少的进展,目前更是面临巨大的发展机遇。如何抓住机遇,促成人机对话系统的进一步发展,是每位研究者都需要认真思考的问题。
1 人机对话系统简述
20世纪60年代,Weizenbaum创建了ELIZA对话系统[1],试图模仿心理治疗师与人进行对话交流;90年代,Seneff 等人开发了自动机票预订系统(ATIS)[2],通过与用户进行多轮对话来获取用户需求(如出发地、出发日期、航班号等),以帮助用户预订机票。这两个系统分别代表了两类不同的对话系统,后者属于目标驱动型对话,前者属于非目标驱动型对话。
目标驱动型人机对话系统通过与用户进行多轮基于自然语言的对话来逐步收集与目标相关的信息,辅助用户成功获得某种服务。与ATIS系统类似的还有电信服务系统HMIHY[3]、天气信息查询系统JUPITER[4]、旅行计划制定系统DARPA Communicator[5]等。目标驱动型的人机对话系统也称为面向任务的人机对话系统。
而以ELIZA系?y为代表的非目标驱动型人机对话系统通常只是对用户输入进行基于自然语言的响应,而不完成特定信息服务任务,类似于闲聊似的对话,所以也称为聊天机器人。与目标驱动型系统相比,这类系统对收集信息、自主确定对话行为等方面的要求都较弱。
一个典型的任务驱动型人机对话系统的技术模块如图1所示[6],系统主要包含自然语言理解(NLU)、对话管理(DM)、自然语言生成(NLG)3个部分。用户输入可以是语音,也可以是文本,如果是语音,则NLU部分包含语音识别模块;而系统输出为语音时,NLG部分还需包含语音合成模块。NLU部分进一步又分解为3个子任务:其一是领域识别,判定用户谈论的是什么领域的事情;其二是意图识别,识别用户话语的目的,比如是告知某个信息,还是确认某个信息;其三是语义分析,又称为槽填充,旨在标识用户话语中与目标有关的语义类别,比如预订机票时需要的出发地、目的地、时间等语义类别。DM则进一步分解为对话状态追踪和动作选择两个子任务;对话状态追踪获取对话的当前状态;动作选择确定系统响应的动作。DM模块负责控制整个对话过程,例如:决定系统在上一轮对话中获取了用户出发地信息之后,下一步该和用户说什么。NLG模块则把决定要说什么具体转化为自然语言,通常也进一步分解为几个子任务。
非目标驱动的对话系统大致按此结构,但是大多没有显式的意图识别、语义标注等NLU过程,也没有显式的DM。
在实际应用中,目标驱动与非目标驱动的划分也并不是绝对的,常常会需要目标驱动和非目标驱动混合出现。比如:目前的个人助理系统Apple Siri、Microsoft Cortana等,有时可能要与用户闲聊,这时是非目标驱动的,有时可能要帮助用户订票,这时是目标驱动的。这一系统框架经历了一系列的发展,其中的各个技术部分也在飞速发展中[7-9]。
2 自然语言理解
人机对话系统中NLU的主要目标是识别输入话语的领域和意图,获得任务相关的语义信息。例如:在订机票时,客户说“订1张5月10号去北京的票”,其领域是“航班信息服务”,意图是“订票”,与订票任务相关的语义信息包括作为“订票数量”的“1张”、作为“起飞时间”的“5月10号”,以
文档评论(0)