统计机器翻译系统中传统词典的应用研究.ppt

统计机器翻译系统中传统词典的应用研究.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计机器翻译系统中传统词典的应用研究

统计机器翻译系统中 传统词典的应用研究 曹杰 任志祥 吕雅娟 刘群 {caojie, renzhixiang, lvyajuan, liuqun}@ 提纲 研究背景 词典在SMT的应用策略 训练部分 解码部分 实际系统中动态词典的使用 实验 总结 研究背景 词典资源分类 词典的分类 普通词典 领域词典 提纲 研究背景 词典在SMT的应用策略 训练部分 解码部分 实用系统中动态词典的使用 实验 总结 训练部分 解码部分 将词典作为特征融入解码 log-linear模型 解码部分 词典特征:互译句对中含有的词条数目 动态词典的使用策略 动态词典的使用策略 提纲 研究背景 词典在SMT的应用策略 训练部分 解码部分 实际系统中动态词典的使用 实验 总结 实验设置 解码器 Camel 语料情况 词典在训练部分作用实验结果 词典在训练部分作用实验结果 词典在训练部分作用实验结果 词典在训练部分作用实验结果 词典在解码部分作用实验结果 动态词典的应用效果 例句 [src] 可活血化瘀、增加血液循环、养血润肤,用于治疗牛皮癣。 [ref] It has blood circulation promoting , blood stasis dispelling , blood circulation improving , blood nourishing , and skin caring effects , and used to treat psoriasis . [without-dict] It is effective for blood circulation promoting dispelling blood stasis, increasing blood circulation, nourishing blood circulation and relaxing the skin, It can be used for the treatment of psoriasis. [dict] 活血化瘀 blood circulation promoting ;养血 nourishing blood; 润肤caring skin [with-dict] It is effective for blood circulation promoting, increasing blood circulation, nourishing blood and caring skin, It can be used for the treatment of psoriasis. 提纲 研究背景 词典在SMT的应用策略 训练部分 解码部分 实际系统中动态词典的使用 实验 总结 总结 词典在统计机器翻译的应用 训练阶段:加权使用词典 解码阶段:加入词典特征 实用系统:动态词典匹配 策略简单但在实际的系统中非常有效! 参考文献 Hua Wu, Haifeng Wang, Chengqing Zong. 2008. Domain Adaptation for Statistical Machine Translation with Domain Dictinary and Monolingual Corpora. In Proceedings of the 22nd International Conference on Computational Linguistics, pages 993-1000. Franz Josef Och, Hermann Ney. 2002. Discriminative Training and Maximum Entropy Models for Statistical Machine Translation. In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics, pages 295-302. Franz Josef Och. 2003. Minimum Error Rate Training in Statistical Machine Translation. In Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics, pages 160-167. Papineni kishore et al. 2002. BLEU: a Method for Automatic Evaluation of Machine Trans

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8016031115000003

1亿VIP精品文档

相关文档