非連续短语翻译研究.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
非連续短语翻译研究

非连续短语翻译研究 张家俊 宗成庆 2012.11.4 1 提纲 统计机器翻译中的非连续短语问题 非连续短语的分类 非连续短语对翻译质量的影响的全面分析 基于非连续短语的规则过滤 总结 2 提纲 统计机器翻译中的非连续短语问题 非连续短语的分类 非连续短语对翻译质量的影响的全面分析 基于非连续短语的规则过滤 总结 3 统计机器翻译中的非连续短语问题 基于连续短语的翻译 4 统计机器翻译中的非连续短语问题 非连续短语的引入 譬如:遭受 X 袭击 ? hit by X 5 统计机器翻译中的非连续短语问题 非连续短语的引入 譬如:遭受 X 袭击 ? hit by X 6 非连续短语的引入有效提升了翻译质量! 提纲 统计机器翻译中的非连续短语问题 非连续短语的分类 非连续短语对翻译质量的影响的全面分析 基于非连续短语的规则过滤 总结 7 非连续短语的分类 根据源语言端、目标语言端是否连续划分 仅源端非连续 遭受 X 袭击 ? hit by X 仅目标端非连续 考虑 X ? take X into account 两端非连续 与 X1 有 X2 ? have X2 with X1 8 非连续短语的分类 对层次短语规则的划分 9 非连续短语的分类 对非连续短语翻译作用的一些研究发现 在汉语到英语的翻译中,不管是利用兼容非连续短语的短语翻译模型、层次短语模型还是基于句法树的翻译模型,都一致发现仅源端非连续的翻译规则对翻译质量的提高要远远好于允许目标端非连续的翻译规则 仅源端非连续 遭受 X 袭击 ? hit by X 10 提纲 统计机器翻译中的非连续短语问题 非连续短语的分类 非连续短语对翻译质量的影响的全面分析 基于非连续短语的规则过滤 总结 11 非连续短语对翻译质量影响的全面分析 疑问 仅源端非连续的翻译规则是否在英语到汉语的翻译中也更有效?是否在其他语言对上也更有效? 非连续短语规则是否在所有语言对之间的翻译都帮助很大? 12 非连续短语对翻译质量影响的全面分析 实验设置 翻译语言对 汉语-英语 德语-英语 法语-英语 西班牙-英语 13 非连续短语对翻译质量影响的全面分析 实验数据规模 汉语-英语 训练集:190万句对 开发集:汉语?英语 MT NIST06, 英语?汉语 MT NIST08前800句 测试集:汉语?英语 MT NIST05 (test-1) MT NIST08 (test-2), 英语?汉语 MT NIST08的后1059句 (test-1),汉英测试集MT NIST05 (test-2) 14 非连续短语对翻译质量影响的全面分析 实验数据规模 其他语言对 训练集:德语-英语、法语-英语 148万句对, 西班牙语-英语 147万句对 开发集:WMT2009 第一部分开发集Devset2009-a 测试集: WMT2009 第二部分开发集Devset2009-b (test-1), WMT2009的测试集Testset2009 (test-2) 15 非连续短语对翻译质量影响的全面分析 实验结果与分析 16 gaps 汉语?英语 英语?汉语 tuning test-1 test-2 tuning test-1 test-2 CR 28.76 28.07 21.78 30.44 30.21 25.44 +SDR 29.46 28.65 22.24 30.60 30.22 25.54 +TDR 28.86 28.26 21.90 30.94 30.75 25.73 +BDR 29.31 28.78 22.33 30.99 30.85 25.62 ALL 29.69 28.87 22.68 31.47 31.31 25.89 汉语-英语 非连续短语对翻译质量影响的全面分析 实验结果与分析 17 gaps 汉语?英语 英语?汉语 tuning test-1 test-2 tuning test-1 test-2 CR 28.76 28.07 21.78 30.44 30.21 25.44 +SDR 29.46 28.65 22.24 30.60 30.22 25.54 +TDR 28.86 28.26 21.90 30.94 30.75 25.73 +BDR 29.31 28.78 22.33 30.99 30.85 25.62 ALL 29.69 28.87 22.68 31.47 31.31 25.89 汉语-英语 非连续短语对翻译质量影响的全面分析 实验结果与分析 18 gaps 汉语?英语 英语?汉语 tuning test-1 test-2 tuning test-1 test-2 CR 28.76 28.07 21.78 30.44 30.21 25.44 +SDR 29.46 28.65 2

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档