第10讲机器翻译ii刘群-自然语言处理.pdf

  1. 1、本文档共102页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第10讲机器翻译ii刘群-自然语言处理

计算语言学 第10讲 机器翻译II 刘群 中国科学院计算技术研究所 liuqun@ict.ac.cn 中国科学院研究生院2006~2007学年第二学期课程讲义 内容提要 • 双语语料库对齐技术 – 句子对齐 – 词语对齐 – 短语对齐(略) • 统计机器翻译方法 • 多引擎机器翻译方法(略) • 机器翻译的评价 计算语言学讲义(04)词法分析I 2 实例库的对齐 • 实例库又称双语语料库(Bilingual Corpus)或 平行语料库(Parallel Corpus) • 双语语料库对齐的级别 – 篇章对齐 – 段落对齐 – 句子对齐 – 词语对齐 – 短语块对齐 – 句法结构对齐 • 基于实例的机器翻译中实例库必须至少做到句 子级别的对齐 计算语言学讲义(04)词法分析I 3 不同对齐级别的差异 • 段落对齐和句子对齐 – 要求保持顺序(允许局部顺序的调整) – 只有一个层次 • 词语对齐和短语块对齐 – 不要求保持顺序 – 只有一个层次 • 句法结构对齐 – 不要求保持顺序 – 多层次对齐 计算语言学讲义(04)词法分析I 4 句子对齐 (1) 汉语 英语 模式 1995年初我来成都的那 I little thought when I arrived in 1:1 天,没想到会是在一个冬 Chengdu in the dark, dark days of 季的漆黑的日子。 winter, early in 1995, that I would still be here more than five years later. 那时我也根本没有想到会 I little knew that I would meet one 2:1 在这儿呆上五年,也不知 of Chengdus daughters, and later 道我会遇到一位成都的女 marry her, thus acquiring a whole 儿,并且后来还娶她为 new family who embraced me as 妻。 one of them, and thus I became 一个完全陌生的家庭接纳 part of this place. 了我,我也因此成为成都 的一部分。 计算语言学讲义(04)词法分析I 5 句子对齐 (2)

文档评论(0)

wangsux + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档