机器翻译原理与方法讲义.pdf

下载文档 降价啦

23
0
约4.73万字
约 120页
2017-11-11 发布于天津
举报
版权申诉
保障服务

机器翻译原理与方法讲义.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

机器翻译原理与方法讲义

机器翻译原理与方法第六讲基于短语的机器翻译方法刘群中国科学院计算技术研究 liuqun@ 中国科学院计算技术研究所2011年秋季课程内容提要 • 对数线性模型 • 最小错误率训练 • 基于对数线性模型的词语对齐 • 基于短语的翻译模型 • 短语模型的解码算法 • 开源机器翻译系统简介 • 总结机器翻译原理与方法(06) 基于短语的机器翻译方法 2 统计机器翻译的对数线性模型(1) • Och 于 ACL2002 提出，思想来源于 Papineni 提出的基于特征的自然语言理解方法，该论文获得 ACL2002 的最佳论文称号 • 不使用信源信道思想，而是采用多特征思想 • 信源信道模型是一种生成模型，而对数线性模型是一种判别模型 • 是一个比信源信道模型更具一般性的模型，信源信道模型是其一个特例 • 原始论文的提法是“最大熵”模型，现在通常使用“对数线性（Log-Linear）模型”这个概念。“对数线性模型”的含义比“最大熵模型”更宽泛，而且现在这个模型通常都不再使用最大熵的方法进行参数训练，因此“对数线性”模型的提法更为准确。 • 与 NLP 中通常使用的最大熵方法的区别：使用连续量（实数）作为特征，而不是使用离散的布尔量（只取0和1值）作为特征机器翻译原理与方法(06) 基于短语的机器翻译方法 3 统计机器翻译的对数线性模型(2) 假设 e、f 是机器翻译的目标语言和源语言句子， h (e,f), …, h (e,f) 分别是 e、f 上的 M 个特征， 1 M λ , …,λ 是与这些特征分别对应的 M 个参数， 1 M 那么直接翻译概率可以用以下公式模拟： P e ∣f =p  ... e ∣f  1 M M exp ∑ m hm e , f  m =1 = M ∑ exp ∑ m hm e , f  e m =1 机器翻译原理与方法(06) 基于短语的机器翻译方法 4 统计机器翻译的对数线性模型(3) 对于给定的 f，其最佳译文 e 可以用以下公式表示： e =argmax P e ∣f  e M =argmax ∑ m hm e , f  e m =1 机器翻译原理与方法(06) 基于短语的机器翻译方法 5 对数线性模型 vs. 噪声信道模型 • 取以下特征和参数时，对数线性模型等价于噪声信道模型： – 仅使用两个特征 – h (e,f)=log p(e) 1 – h (e,f)=log p(f|e) 2