- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要
摘要
基于短语的统计机器翻译是机器翻译研究的一个热点。当前汉英等语言间
的统计机器翻译研究条件不仅双语平行语料库规模充足,而且相关语言的词法、
句法分析等方面的基础性研究也十分成熟,这就为其研究提供了一个良好的平
厶
口。
但是,以上条件对于汉蒙统计机器翻译还很匮乏。这方面研究的困难主要
有两点:第一,蒙古语信息化建设相对于汉语来说比较滞后,不仅平行语料库
建设规模较小,而且词法及句法分析方面的基础性研究还正在跟进,这很大程
度限制了汉蒙统计机器翻译的发展;第二,由于蒙古语属于黏着语,形态变化
极为丰富,与作为孤立语的汉语形式相差甚远,因此汉蒙统计机器翻译存在的
问题较多,尤其表现在译文词形错误及语序混乱这两个方面。
本文以汉蒙统计机器翻译为研究对象。针对蒙古语形态变化丰富这一特点,
将形态因子引入到汉蒙统计机器翻译中,通过因子化模型充分利用了蒙古语的
形态信息;针对汉蒙平行语料库规模较小这一问题,将基于词典的词对齐方法
产生的词对齐点融合到IBM词对齐模型中,并利用蒙古语的词干形态知识提高
基于词典方法的汉蒙词对齐质量,再利用融合后的词对齐点训练短语翻译模型,
进而用于基于短语的汉蒙统计机器翻译,最终提高译文质量。
在统计机器翻译中,翻译模型是唯一不可取代的模型,其重要性不言而喻。
针对训练过程造成的短语翻译模型中短语翻译对冗余问题,本文设计并实现了
一种通用的基于统计方法的短语翻译模型过滤器,这种过滤器可以根据不同的
统计方法对翻译模型进行降噪,在有效降低短语翻译模型规模的同时对统计机
器翻译译文的质量影响甚微。
关于本研究所提的每部分都有相关对比实验,通过这些对比实验来验证本
文所提方法的有效性,同时也探讨了一些方法继续深入研究的可能性。
关键词: 统计机器翻译;因子化模型;词对齐融合;翻译模型过滤
Abstract
ABSTRACT
Phrase。basedstatisticalmachinetranslationisa inmachinetranslation
hotspot
astheconditionsofthe statisticalmachine
research.Currently,such Chinese—English
translationarenot thesizeofthe is also
only bilingualparallelcorporaadequate,but
the and ofthebasicresearchisalso
morphologicalanalysissyntactic very
analysis
mature.Sothattheseconditionsa fortheirresearch.
provide
goodplatform
above for statisticalmachine
However,theconditions
Chinese—Mongolian
translationarestillscarce.Theretwo inthis
are difficulties
major area:Firstly,the
is
您可能关注的文档
最近下载
- 2024年上海市奉贤区高三下学期高考二模英语试卷含答案.doc VIP
- 2025年钢结构厂房施工组织设计方案(DOC41页).pdf VIP
- 企业数字化转型战略实践与启示(51页PPT).pptx VIP
- 中考英语复习精补全对话习题50道.doc VIP
- 14D504 接地装置安装.docx VIP
- 2024年高考语文复习:修改病句 专项练习题(含答案解析).docx VIP
- 低压开关设备和控制设备 第2部分:断路器 PPT.ppt VIP
- 消杀技术培训.pptx VIP
- Photoshop CS6 实例教程(第6版)教学教案.doc VIP
- 西南大学(0209)《文字学》23秋机考2小篆.docx VIP
文档评论(0)