可移植汉语口语话系统的研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
可移植汉语口语话系统的研究

摘 要 面对海量的数字信息,口语对话系统能使人们以自然口语的交互方式,直接 准确地获取信息。但目前口语对话系统只能局限于特定的任务域,即便如此,丌 发一个特定任务域的对话系统,仍然是一项巨大的工程。因此,可移植的对话系 统证成为研究热点。 本文针对可移植对话系统的模型框架,可移植对话系统中口语识别和口语理 解的任务域移植等问题,进彳亍了初步研究,提出了一些新的模型、方法和策略。 主要工作包括如下几个方面: 一、 可移植对话系统通用框架的研究 1)从任务域移植的角度,提出了对话系统的分层模型。由底层至顶层,将 对话系统分为任务数据层、任务解析层、通用数据层和系统功能层四个 层次。顶上两层与任务无关,底下两层与任务相关。 2)在分层模型的基础上,提出了可移植对话系统的通用框架,整个框架模 型的提出侧重子技术实现的角度,适用于信息查询领域。本文深入剖析了 可移植对话系统的各个组成模块,给出了规范标准的任务域移植过程。 在移植过程中,任务数据层由开发者建立,任务解析层由系统依据任务 数据层自动生成,训练过程采用数据驱动的方法。 二、 口语识别模块任务域移植的研究 1)提出了基于对话回合衰减的Cache自适应语言模型,以在线递增的方式 训练并建立起新任务域的语言模型。口语识别包含声学模型和语言模型 两个数据模块。声学模型属于通用数据层,与任务无关。语言模型属于 任务解析层,与任务相关。在移植过程中,需要建立起新任务域的语言 模型,从而实现口语识别的任务域移植。 三、 口语理解模块任务域移植的研究 1) 提出了基于关键短语的句子理解方法,依据任务域的短语理解文法,对 用户输入的多种类型的查询语句进行理解。短语理解文法属于任务解析 层,与任务相关,通过短语理解文法的替换,可以实现口语理解的任务 域移植。 21 提出了对话语境指导下的上下文理解方法,上下文理解是对句子理解的 结果再次进行分析,包括省略分析和语义概念的量化。我们给出了可计 算的对话语境的定义,并应用于口语的省略分析。对话语境属于任务解 析层,由对话管理模块依据对话历史自动生成。常识规则作用于语义概 念的量化过程,属于通用数据层,可以预先拟定。 3) 针对未标注语料,提出了口语理解自动建模的方法,最大限度的减轻了 普通开发者的负担。该方法从未标注的语料中,自动提取任务域短语, 并进行语义聚类,依据聚类结果生成任务域的短语理解文法。在自动建 模的过程中,我们首次提出了同步衰减频率的概念,并应用于任务域短 语的自动提取,定义了一种新的语义相似度,并应用于关键短语的自动 语义聚类。 四、 可移植对话系统实例的构建 1)在上述研究的基础上,本文最终实现了两个可移植对话系统的实例。我 们首先精心建立了一个颐和园导游对话系统,该系统包含完整的语音输 入输出,具有良好的可移植对话系统模型结构。然后通过将系统移植到 列车信息查询任务域,快速简单的建立了一个列车信息查询对话系统。 颐和园导游对话系统的字识别准确率为96.1%、概念理解准确率为93.8%, 系统响应适当性为92.3%,列车信息查询对话系统的字识别准确率为 90.9%、概念理解准确率为91.3%,系统响应适当性为90.1%,实验结果 表明本文所提出的模型和方法取得了良好效果。 关键词:口语对话系统,可移植对话系统,任务域移植,口语识别,口语理解 ll Abstract Confrontedwitha amountof couldobtain knowledge,people huge digital informat

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档