基于错误驱动学习的机器翻译后编辑建模-计算机科学与技术专业论文.docxVIP

下载本文档

5
0
约5.5万字
约 68页
2019-02-20 发布于上海
举报
版权申诉

基于错误驱动学习的机器翻译后编辑建模-计算机科学与技术专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

万方数据万方数据 Classified Index: TP391.2 U.D.C.: 681.37 Dissertation for the Master Degree in Engineering ERROR DRIVEN LEARNING BASED MACHINE TRANSLATION POST- EDIT MODELING Candidate： Yao Jia Supervisor： Prof. Yang Muyun Academic Degree Applied for： Master of Engineering Speciality： Computer Science and Technology Affiliation： School of Computer Science and Technology Date of Defence： June, 2014 Degree-Conferring-Institution： Harbin Institute of Technology 哈尔滨工业大学工学硕士学位论文哈尔滨工业大学工学硕士学位论文摘要现有机器翻译引擎依然远远满足不了用户的需求，用户往往需要对机器译文进行大量的重复性的错误修正，而机器译文中这种重复性错误的修正会消耗用户大量的时间而降低用户体验。为此，不少研究就机器译文自动后编辑进行了相关工作。但是，主流的后编辑方法是基于统计机器翻译（SMT）的后编辑，而 SMT 的不透明性为研究机器译文不足带来了困难。在这种背景下，本文引入错误驱动学习机制，分别面向译词错误与词序错误进行后编辑规则学习，从而提高机器译文质量。本文的具体研究内容涉及如下几个方面： (1) 面向译词错误的错误驱动学习建模。现有机器引擎给出的译文往往会出现多词、少词、错词的翻译错误，为此，本文在错误驱动学习的框架下，面向译词错误学习增删改后编辑规则。并通过机器译文的质量变化来检验增删改后编辑规则的性能。 (2) 面向词序错误的错误驱动学习建模。现有机器引擎给出的译文往往会出现词序错误的翻译错误，为此，本文首先通过对齐交叉定义词序错误，并在错误驱动学习的框架下，面向词序错误学习调序后编辑规则。通过机器译文质量的变化来检验调序后编辑规则的性能。 (3) 基于混合策略的错误驱动学习建模。机器译文错误包含着译词错误与词序错误，为了能够同时解决机器译文中的译词错误与词序错误，我们通过两种策略进行模型级别的融合。首先通过级联式翻译错误驱动学习融合增删改后编辑规则与调序后编辑规则，然后再进行迭代式翻译错误驱动学习。并均在数据集上检验模型的性能。关键词后编辑；自动后编辑；错误驱动；规则； - I - Abstract The existing Machine Translation engine cannot meet the needs of users, and users often need to correct a large number of similar errors existing in machine translations. Corrections of the repeatable error will cost too much time and hurt the user feedback. Therefore, there are many researches on machine translation automatic post editing. However, the mainstream of the post editing method is based on statistical machine translation (SMT), but opacity of SMT brings problems to researches. In this context, this paper introduces error driven learning mechanisms, respectively, for translation errors and word order erro rs with extracting post-editing rule, so as to improve the quality of machine translation. The main research contents in this paper include the following aspects: Error driven learning modeling for the translat