层次短语翻译模研究和改进.pdfVIP

  • 6
  • 0
  • 约6.43万字
  • 约 54页
  • 2016-02-29 发布于贵州
  • 举报
层次短语翻译模研究和改进

摘要 机器翻译是应用电子计算机实现从一种自然语言到另外一种自然语言的翻 译。它属于计算语言学的范畴。经过几十年的发展,机器翻译在理论和实践方面 都取得了非常大的进展,基于统计的方法是当前机器翻译的主流方法。 David Chiang提出的层次短语模型已成为统计机器翻译中的主流模型之一, 它在短语模型的基础上引入了非终结符,使模型具有了泛化能力,突破了短语模 型只允许完全子串匹配的局限;它引入了层次短语,使模型具有了较好的远距离 调序能力。 层次短语翻译模型在取得巨大成功的同时,也具有明显的缺点,本文针对层 次短语模型的不足进行改进,主要做了以下三点工作: 一针对层次短语模型的层次规则抽取方法简单,存在大量无用,不合理的 层次规则,造成模型规模庞大,解码费时与解码错误的问题,本文探讨了基于泛 化能力的规则约束策略,通过是否具有泛化能力来衡量一条层次规则的有用性, 过滤掉无用的层次规则。 二针对层次短语模型解码过程中很多不合理规则的使用造成解码空问急剧 扩张、在耗费大量解码时间的同时,造成解码错误的问题,我们对基于句法分析 的层次短语模型解码优化做了初步的探讨,提出了使用句法信息限制不合理规则 的使用的解码约束策略。

文档评论(0)

1亿VIP精品文档

相关文档