- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
机器翻译原理与方法讲义
机器翻译原理与方法
第六讲 基于短语的机器翻译方法
刘群
中国科学院计算技术研究
liuqun@
中国科学院计算技术研究所2011年秋季课程
内容提要
• 对数线性模型
• 最小错误率训练
• 基于对数线性模型的词语对齐
• 基于短语的翻译模型
• 短语模型的解码算法
• 开源机器翻译系统简介
• 总结
机器翻译原理与方法(06) 基于短语的机器翻译方法 2
统计机器翻译的对数线性模型(1)
• Och 于 ACL2002 提出,思想来源于 Papineni 提出的基于特征的自
然语言理解方法,该论文获得 ACL2002 的最佳论文称号
• 不使用信源信道思想,而是采用多特征思想
• 信源信道模型是一种生成模型,而对数线性模型是一种判别模型
• 是一个比信源信道模型更具一般性的模型,信源信道模型是其一个
特例
• 原始论文的提法是“最大熵”模型,现在通常使用“对数线性
(Log-Linear)模型”这个概念。“对数线性模型”的含义比“最
大熵模型”更宽泛,而且现在这个模型通常都不再使用最大熵的方
法进行参数训练,因此“对数线性”模型的提法更为准确。
• 与 NLP 中通常使用的最大熵方法的区别:使用连续量(实数)作为
特征,而不是使用离散的布尔量(只取0和1值)作为特征
机器翻译原理与方法(06) 基于短语的机器翻译方法 3
统计机器翻译的对数线性模型(2)
假设 e、f 是机器翻译的目标语言和源语言句子,
h (e,f), …, h (e,f) 分别是 e、f 上的 M 个特征,
1 M
λ , …,λ 是与这些特征分别对应的 M 个参数,
1 M
那么直接翻译概率可以用以下公式模拟:
P e ∣f =p ... e ∣f
1 M
M
exp ∑ m hm e , f
m =1
=
M
∑ exp ∑ m hm e , f
e m =1
机器翻译原理与方法(06) 基于短语的机器翻译方法 4
统计机器翻译的对数线性模型(3)
对于给定的 f,其最佳译文 e 可以用以下公
式表示:
e =argmax P e ∣f
e
M
=argmax ∑ m hm e , f
e m =1
机器翻译原理与方法(06) 基于短语的机器翻译方法 5
对数线性模型 vs. 噪声信道模型
• 取以下特征和参数时,对数线性模型等价
于噪声信道模型:
– 仅使用两个特征
– h (e,f)=log p(e)
1
– h (e,f)=log p(f|e)
2
您可能关注的文档
最近下载
- 甲骨文与青铜器课件.ppt VIP
- 《2025年CSCO宫颈癌诊疗指南》更新要点解读PPT课件.pptx VIP
- 《分数乘除混合运算》示范公开课教学设计【青岛版小学六年级数学上册】.pdf VIP
- 部编版11.一块奶酪 教学设计教案 三年级语文上册(带板书设计、教学反思)3.docx VIP
- 静脉采血技术操作规范2025版.docx VIP
- 最全的日语汽车词汇汇总.docx VIP
- 护理组织管理体系与职责分工..doc VIP
- 2025食品生产通用卫生规范年GB14881试题及参考答案.docx VIP
- 屈光手术科普知识.pptx VIP
- 2025年高考数学全国新课标Ⅰ卷试卷评析及备考策略(课件).pptx VIP
文档评论(0)