- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据
万方数据
Classified Index: TP391.2 U.D.C.: 681.37
Dissertation for the Master Degree in Engineering
ERROR DRIVEN LEARNING BASED MACHINE TRANSLATION POST- EDIT MODELING
Candidate: Yao Jia
Supervisor: Prof. Yang Muyun
Academic Degree Applied for: Master of Engineering
Speciality: Computer Science and Technology
Affiliation: School of Computer Science and Technology
Date of Defence: June, 2014
Degree-Conferring-Institution: Harbin Institute of Technology
哈尔滨工业大学工学硕士学位论文
哈尔滨工业大学工学硕士学位论文
摘 要
现有机器翻译引擎依然远远满足不了用户的需求,用户往往需要对机器 译文进行大量的重复性的错误修正,而机器译文中这种重复性错误的修正会 消耗用户大量的时间而降低用户体验。为此,不少研究就机器译文自动后编 辑进行了相关工作。但是,主流的后编辑方法是基于统计机器翻译(SMT) 的后编辑,而 SMT 的不透明性为研究机器译文不足带来了困难。在这种背 景下,本文引入错误驱动学习机制,分别面向译词错误与词序错误进行后编 辑规则学习,从而提高机器译文质量。本文的具体研究内容涉及如下几个方 面:
(1) 面向译词错误的错误驱动学习建模。现有机器引擎给出的译文往往 会出现多词、少词、错词的翻译错误,为此,本文在错误驱动学习的框架下, 面向译词错误学习增删改后编辑规则。并通过机器译文的质量变化来检验增 删改后编辑规则的性能。
(2) 面向词序错误的错误驱动学习建模。现有机器引擎给出的译文往往 会出现词序错误的翻译错误,为此,本文首先通过对齐交叉定义词序错误, 并在错误驱动学习的框架下,面向词序错误学习调序后编辑规则。通过机器 译文质量的变化来检验调序后编辑规则的性能。
(3) 基于混合策略的错误驱动学习建模。机器译文错误包含着译词错误 与词序错误,为了能够同时解决机器译文中的译词错误与词序错误,我们通 过两种策略进行模型级别的融合。首先通过级联式翻译错误驱动学习融合增 删改后编辑规则与调序后编辑规则,然后再进行迭代式翻译错误驱动学习。 并均在数据集上检验模型的性能。
关键词 后编辑;自动后编辑;错误驱动;规则;
- I -
Abstract
The existing Machine Translation engine cannot meet the needs of users, and users often need to correct a large number of similar errors existing in machine translations. Corrections of the repeatable error will cost too much time and hurt the user feedback. Therefore, there are many researches on machine translation automatic post editing. However, the mainstream of the post editing method is based on statistical machine translation (SMT), but opacity of SMT brings problems to researches. In this context, this paper introduces error driven learning mechanisms, respectively, for translation errors and word order erro rs with extracting post-editing rule, so as to improve the quality of machine translation. The main research contents in this paper include the following aspects:
Error driven learning modeling for the translat
您可能关注的文档
- 基于超声技术的车辆信息检测系统的设计与实现-交通信息工程及控制专业论文.docx
- 基于粗糙集与熵权的房地产上市企业综合竞争力评价研究-企业管理专业论文.docx
- 基于超声检测的混凝土冻融损伤模型研究-结构工程专业论文.docx
- 基于超声减摩原理的气缸运动副摩擦特性研究-机械工程专业论文.docx
- 基于粗糙集与神经网络的建筑安全预测研究-技术经济及管理专业论文.docx
- 基于超声射频信号的心肌弹性成像的研究-生物医学工程专业论文.docx
- 基于粗糙集与神经网络的调制信号识别研究-电路与系统专业论文.docx
- 基于超声衰减的纸浆浓度检测系统研究-控制理论与控制工程专业论文.docx
- 基于粗糙集与未确知测度理论的供应商风险评估方法研究-管理科学与工程专业论文.docx
- 基于超声图像的乳腺癌辅助检测关键技术研究-计算机科学与技术专业论文.docx
- 基于错误实例与错误特征相结合的语法检查系统的实现-计算机软件与理论专业论文.docx
- 基于车型识别的卡口系统的研究和应用-电子与通信工程专业论文.docx
- 基于车用总线的车窗控制系统的设计与研究-电路与系统专业论文.docx
- 基于哒嗪并吡咯二酮的共轭聚合物的合成与性能研究-材料学专业论文.docx
- 基于车载CAN网络的仿真测试平台的研发-机械工程专业论文.docx
- 基于车载LiDAR系统的高精度路面高程测量应用研究-测绘科学与技术专业论文.docx
- 基于达尔文流媒体服务器TS流推送模块的设计与实现-软件工程专业论文.docx
- 基于车载测量系统的激光扫描仪检校研究与应用-地图学与地理信息系统专业论文.docx
- 基于达芬奇技术的玻璃缺陷在线检测系统的设计-机械设计及理论专业论文.docx
- 基于车载测图系统的室内调绘新技术研究-摄影测量与遥感专业论文.docx
最近下载
- 《生态系统的结构和功能》教学设计-2025-2026学年人教版(2024)初中生物八年级上册.docx VIP
- 中成药处方点评专家共识的解读.pptx
- 管理人员台账+特种作业人员台账.docx VIP
- 《冶金企业和有色金属企业安全生产规定》、《生产安全事故罚款处罚规定》试题.docx VIP
- 人教版2025-2026学年八年级历史上册教学工作计划(及进度表).docx
- 整车开发流程培训.pptx VIP
- 残疾人就业指导培训项目组织机构及人员配备.docx VIP
- 体格检查之腹部检查.ppt VIP
- 《中华优秀传统文化》(卢志宁)089-2教案 第8课 中医诊疗与养生.pdf VIP
- 巨人通力GPN65KM(KDL or KDM)-YH无机房电气原理图纸_51833752D04D-2023-9.pdf
文档评论(0)