- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蒙汉机器翻译论文:基于短语的蒙汉统计机器翻译研究
【中文摘要】随着计算机性能的逐渐提高,统计方法在机器翻译中得到了广泛的应用。统计机器翻译方法主要有基于词的翻译模型、基于短语的翻译模型和基于句法的翻译模型。基于短语的翻译模型比基于词的翻译模型在翻译质量上提高了很多,同时基于短语的翻译模型比基于句法的翻译模型具有模型简单、训练速度快、解码效率高等优势。因此基于短语的机器翻译方法逐渐成为了统计机器翻译领域的研究热点。首先,本文阐述了统计机器翻译的相关理论,并结合蒙古文信息处理技术的现状,利用国际现有开源软件搭建了一个基于短语的蒙汉统计机器翻译系统,该系统将蒙古语文本自动翻译成汉语文本。其次,本文建立了开发集和测试集,并通过收集和建立这两种途径获得一定规模的蒙汉平行语料库。在此基础上对蒙汉统计机器翻译系统做了一些实验。其中以规模为8万对句的蒙汉平行语料库作为翻译模型的训练语料,将规模为400对句的测试语料进行开放测试之后得到的评测结果BLEU和NIST值分别为0.2353和5.1859。通过实验结果发现,与国际先进系统相比,翻译结果的差距较大,研究中仍存在一些问题,比如:译文中存在未登陆词,语序混乱及语法、语义歧义等问题。最后,针对上述问题,为提高蒙汉...
【英文摘要】With the gradual improvement of computer performance, statistical method has been widely used in machine translation. The statistical machine translation methods mainly include word-based translation model、phrase-based translation model and syntax-based translation model. The phrase-based translation model is improved a lot than word-based translation model on the quality of translation, and it also has the advantages of having simple model, training fast and decoding efficiently, compared with syntax-based...
【关键词】蒙汉机器翻译 短语 翻译模型 语言模型 因子化模型
【英文关键词】Mongolian-Chinese Machine Translation Phrase Translation Model Language Model Factored Model
【索购全文】联系Q1:138113721 Q2:139938848
同时提供论文写作一对一辅导和论文发表服务.保过包发
【目录】基于短语的蒙汉统计机器翻译研究
中文摘要
4-5
ABSTRACT
5-6
第一章 绪论
10-17
1.1 研究背景与选题意义
10-11
1.2 国内外研究现状
11-13
1.2.1 国外研究现状
11-12
1.2.2 国内研究现状
12-13
1.3 研究方法和研究目标
13-15
1.3.1 研究方法
13-14
1.3.2 研究目标
14-15
1.4 论文的组织
15-17
第二章 统计机器翻译的相关理论
17-25
2.1 翻译模型的框架
17-20
2.1.1 噪音信道模型
17-18
2.1.2 对数线性模型
18-20
2.2 基于短语的统计机器翻译方法
20-23
2.2.1 基于短语的翻译模型
20-21
2.2.2 短语翻译模型的特点
21-22
2.2.3 短语翻译模型的翻译过程
22-23
2.3 机器翻译的自动评测标准
23-25
2.3.1 BELU评测标准
23-24
2.3.2 NIST评测标准
24-25
第三章 蒙汉统计机器翻译系统的搭建
25-48
3.1 运行环境及相关开源工具
25-26
3.1.1 运行环境
25
3.1.2 相关开源工具
25-26
3.2 系统的整体框架
26-27
3.3 蒙汉统计机器翻译系统
27-44
3.3.1 语料库的收集与处理
27-30
3.3.2 模型训练
30-37
3.3.3 解码
37-38
3.3.4 翻译结果的自动评测
38-44
3.4 实验结果及分析
44-48
3.4.1 实验数据
44
3.4.2 实验结果及分析
44-48
第四章 融合词性因素的蒙汉统计机器翻译
48-55
4.1 因子化统计模型的概述
48-49
4.2 语料库的词性标注
4
您可能关注的文档
- 层流手术室环境与设备管理的研究进展.doc
- 春季预防猪病综合措施.doc
- 词性和句子成分.doc
- 大株红景天联合阿司匹林治疗急性脑梗临床疗效观察.doc
- 胆石症发病机制第研究进展.doc
- 电镜技术和细胞超微结构_三个实验报告.doc
- 电针治疗对糖尿病伴发周围性面瘫的作用与机制探讨.doc
- 过氧乙酸使用方法.doc
- 河北省中医药管理局.doc
- 湖南新化山歌的概况及其历史传承和发展.doc
- 中国行业标准 DB/T 100-2024区域性地震安全性评价.pdf
- 《GM/T 0138-2024C-V2X车联网证书策略与认证业务声明框架》.pdf
- GM/T 0138-2024C-V2X车联网证书策略与认证业务声明框架.pdf
- DB/T 100-2024区域性地震安全性评价.pdf
- 中国行业标准 GM/T 0138-2024C-V2X车联网证书策略与认证业务声明框架.pdf
- 校园周边书店阅读氛围对初中生阅读素养提升的影响研究教学研究课题报告.docx
- 初中校园餐饮卫生监管与食品安全教育创新模式研究教学研究课题报告.docx
- 《文化遗产保护与旅游开发平衡机制的法律法规完善研究》教学研究课题报告.docx
- 《农作物病虫害生物防治技术的经济效益与社会影响分析》教学研究课题报告.docx
- 1 剖宫产术后子宫瘢痕憩室治疗中的并发症预防与护理措施教学研究课题报告.docx
文档评论(0)