- 1、本文档共45页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关于机器翻译中的参数学习问题的思考
关于机器翻译中的参数学习问题的思考
黄书剑
计算机软件新技术国家重点实验室
南京大学计算机科学与技术系
提纲
n 参数是什么?
n 参数如何学习?
n 我们的一些尝试
n 思考和总结
15/10/8 2
统计机器翻译中的模型参数
参数是什么?
15/10/8 3
生成式模型中的参数
n 生成式模型:The Source-Channel Model [Brown et al. 1993]
¡ 参数即概率模型
语言模型 翻译模型
¡ 概率模型的估计采用训练数据上的极大似然估计进行
15/10/8 4
判别式模型中的参数
n 判别式模型:Log-linear Models [Och and Ney, 2002]
¡ 参数包括子模型参数及对数线性模型参数
对数线性模
型的参数
子模型参数:
短语翻译模型
词翻译模型
语言模型
…
15/10/8 5
子模型之间的参数
n 对数线性模型的参数描述了不同子模型之间的组
合关系
n 两个子模型共同决策的例子:
¡ 语言模型(LM)偏向短的翻译
¡ 词计数(WC )偏向长的翻译
¡ “ 中国”: “China”
“People ’s Republic of China”
¡ 一个给定的对数线性模型会在LM和WC 间给出平衡
15/10/8 6
子模型之间的参数(cont.)
n 对数线性模型的参数描述了不同子模型之间的组
合关系
n 当有第三个子模型参与决策时:
¡ 语言模型(LM)偏向短的翻译
¡ 词计数(WC )偏向长的翻译
¡ 翻译模型(TM )描述翻译质量
¡ “办公室”: “office”
“the office of”
“the office of the”
疑惑:不同词、句可以用同一组线性组合参数描述吗?
15/10/8 7
问题一
n 如何表示子
您可能关注的文档
最近下载
- 第十课 养成遵纪守法好习惯(实用课件)-【中职专用】中职思想政治《职业道德与法治》高效课堂精品实用课件+教案(高教版2023·基础模块).pptx
- 观察案例小班午睡记录与分析.docx VIP
- 最新高考英语3500单词快速记忆法(联想记忆).doc
- 2022年人教版中考生物复习知识点思维导图 主题三 生物圈中的绿色植物.ppt VIP
- 筝韵系京腔,古乐传今声——筝曲《夜深沉》《戏韵》探析.pdf
- 个人血糖监测记录表.docx VIP
- 初中英语课堂活动设计与实施计划.docx VIP
- 教育学 (王道俊 郭文安) (Z-Library)_4.pdf VIP
- 创新管理(浙江大学)中国大学MOOC 慕课章节测验及期末考试客观题答案.docx
- 基于核心素养培养的初中英语课堂活动设计分析.docx VIP
文档评论(0)