网站大量收购独家精品文档,联系QQ:2885784924

关于机器翻译中的参数学习问题的思考.pdf

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关于机器翻译中的参数学习问题的思考

关于机器翻译中的参数学习问题的思考 黄书剑 计算机软件新技术国家重点实验室 南京大学计算机科学与技术系 提纲 n  参数是什么? n  参数如何学习? n  我们的一些尝试 n  思考和总结 15/10/8 2 统计机器翻译中的模型参数 参数是什么? 15/10/8 3 生成式模型中的参数 n  生成式模型:The Source-Channel Model [Brown et al. 1993] ¡  参数即概率模型 语言模型 翻译模型 ¡  概率模型的估计采用训练数据上的极大似然估计进行 15/10/8 4 判别式模型中的参数 n  判别式模型:Log-linear Models [Och and Ney, 2002] ¡  参数包括子模型参数及对数线性模型参数 对数线性模 型的参数 子模型参数: 短语翻译模型 词翻译模型 语言模型 … 15/10/8 5 子模型之间的参数 n  对数线性模型的参数描述了不同子模型之间的组 合关系 n  两个子模型共同决策的例子: ¡  语言模型(LM)偏向短的翻译 ¡  词计数(WC )偏向长的翻译 ¡  “ 中国”: “China” “People ’s Republic of China” ¡  一个给定的对数线性模型会在LM和WC 间给出平衡 15/10/8 6 子模型之间的参数(cont.) n  对数线性模型的参数描述了不同子模型之间的组 合关系 n  当有第三个子模型参与决策时: ¡  语言模型(LM)偏向短的翻译 ¡  词计数(WC )偏向长的翻译 ¡  翻译模型(TM )描述翻译质量 ¡  “办公室”: “office” “the office of” “the office of the” 疑惑:不同词、句可以用同一组线性组合参数描述吗? 15/10/8 7 问题一 n  如何表示子

文档评论(0)

suijiazhuang1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档