机器翻译原理与方法讲义.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
机器翻译原理与方法讲义

机器翻译原理与方法 第六讲 基于短语的机器翻译方法 刘群 中国科学院计算技术研究 liuqun@ 中国科学院计算技术研究所2011年秋季课程 内容提要 • 对数线性模型 • 最小错误率训练 • 基于对数线性模型的词语对齐 • 基于短语的翻译模型 • 短语模型的解码算法 • 开源机器翻译系统简介 • 总结 机器翻译原理与方法(06) 基于短语的机器翻译方法 2 统计机器翻译的对数线性模型(1) • Och 于 ACL2002 提出,思想来源于 Papineni 提出的基于特征的自 然语言理解方法,该论文获得 ACL2002 的最佳论文称号 • 不使用信源信道思想,而是采用多特征思想 • 信源信道模型是一种生成模型,而对数线性模型是一种判别模型 • 是一个比信源信道模型更具一般性的模型,信源信道模型是其一个 特例 • 原始论文的提法是“最大熵”模型,现在通常使用“对数线性 (Log-Linear)模型”这个概念。“对数线性模型”的含义比“最 大熵模型”更宽泛,而且现在这个模型通常都不再使用最大熵的方 法进行参数训练,因此“对数线性”模型的提法更为准确。 • 与 NLP 中通常使用的最大熵方法的区别:使用连续量(实数)作为 特征,而不是使用离散的布尔量(只取0和1值)作为特征 机器翻译原理与方法(06) 基于短语的机器翻译方法 3 统计机器翻译的对数线性模型(2) 假设 e、f 是机器翻译的目标语言和源语言句子, h (e,f), …, h (e,f) 分别是 e、f 上的 M 个特征, 1 M λ , …,λ 是与这些特征分别对应的 M 个参数, 1 M 那么直接翻译概率可以用以下公式模拟: P e ∣f =p  ... e ∣f  1 M M exp ∑ m hm e , f  m =1 = M ∑ exp ∑ m hm e , f  e m =1 机器翻译原理与方法(06) 基于短语的机器翻译方法 4 统计机器翻译的对数线性模型(3) 对于给定的 f,其最佳译文 e 可以用以下公 式表示: e =argmax P e ∣f  e M =argmax ∑ m hm e , f  e m =1 机器翻译原理与方法(06) 基于短语的机器翻译方法 5 对数线性模型 vs. 噪声信道模型 • 取以下特征和参数时,对数线性模型等价 于噪声信道模型: – 仅使用两个特征 – h (e,f)=log p(e) 1 – h (e,f)=log p(f|e) 2

文档评论(0)

zhuwo + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档