- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于短语的汉蒙统计机器翻译研究
王斯日古楞 1,2,斯琴图 3,那顺乌日图 2
WANG Siriguleng1,2,Siqintu3,Nasun-urtu2
1.内蒙古师范大学 计算机与信息工程学院,呼和浩特 010022
2.内蒙古大学 蒙古学学院,呼和浩特 010021
3.内蒙古师范大学 网络中心,呼和浩特 010022
1.College of Computer and Information Engineering,Inner Mongolia Normal University,Hohhot 010022,China
2.School of Mongolian Studies,Inner Mongolia University,Hohhot 010021,China
3.Network Center,Inner Mongolia Normal University,Hohhot 010022,China
E-mail: HYPERLINK mailto:siriguleng@ s HYPERLINK mailto:iriguleng@ iriguleng@
WANG Siriguleng,Siqintu,Nasun -urtu.Phrase -based Chinese Mongolian statistical machine translation.Computer Engi-
neering and Applications,2010,46(14):138-142.
Abstract:The current mainstream approach to statistical machine translation is the phrase-based model.This paper presents the
method of how to build phrase-based Chinese Mongolian statistical machine translation system using the existing technologies and resources.An automatic evaluation platform for Chinese Mongolian machine translation is also built.Thus,the performance of trans- lation system is improved by the use of dictionary and Mongolian morphological information.
Key words:phrase;Chinese Mongolian statistical machine translation;automatic evaluation;morphological
摘 要:基于短语的统计机器翻译是当前统计机器翻译的主流方法。研究了利用现有技术和资源搭建一个基于短语的汉蒙机器翻
译系统的方法,并且构建了一个汉蒙机器翻译的自动评价平台,在此基础上利用词典和蒙古语形态学信息来提高了翻译系统的性能。
关键词:短语;汉蒙统计机器翻译;自动评测;形态学
DOI:10.3778/j.issn.1002-8331.2010.14.041
文章编号:1002-8331(2010)14-0138-05
文献标识码:A
中图分类号:TP391.2
1 引言
关于汉蒙机器翻译,曾经做过基于规则的研究[1]和基于实 例的研究[2]。但是由于语言资源不足,研究人员和资金短缺,以
及蒙古语言本身的复杂性等原因,汉蒙机器翻译的研究进展比 较缓慢。近几年,随着统计方法在机器翻译领域的成功应用,统
计机器翻译已经成为机器翻译的主流方法。同时,在统计机器
翻译领域,有很多开源工具供研究人员免费使用,这促进了统 计机器翻译的快速发展。在现有汉蒙机器翻译研究的技术和资
源基础上,结合统计机器翻译的开源工具,开展了基于短语的 汉蒙机器翻译研究。
相应的搜索公式为:
I
argmax P(r e )P(r f |e )
J I
(2)
I
e 1 1 1
1
I
其中 P(r e1)被称为语言模型,反映了一个句子在目标语言中出
现的可能性,实际上就是该句子在句法语义等方面的合理程
J I
度;P(r f |e )被称为翻译模型,反映了两个句子互为翻译的可
1 1
能性,翻译模型将源语言句子与目标语言句子连接起来 。
BROWN 等[4]中提出了 5 个翻译
您可能关注的文档
- 地理信息公共服务平台公共地理框架数据:地名地址数据生产技术规程.doc
- 地理高考二轮专题复习课件一第三讲:地理空间定位和区域特征分析.ppt
- 地表注浆施工方案.doc
- 地质勘探常见事故分析与预防.ppt
- 地质灾害减灾对策与减灾效益分析.ppt
- 地质构造讲座.ppt
- 地质毕业设计 矿井构造分析.doc
- 地铁一号线续建工程沿线物业分析报告.doc
- 地铁人群调查分析报告.ppt
- 地铁工程杂散电流监测防护系统讲稿.ppt
- 2025年-2025年福建省电工资格考试低压考试题(含答案) .pdf
- 2025年-2025年福建省电工职业资格低压考题(含答案) .pdf
- 2025年-2025年福建省电工低压考试试题试卷(含答案) .pdf
- 2025年-2025年福建省电工职业资格低压培训模拟题(含答案) .pdf
- 2025年-2025年福建省电工职业资格低压考试预测试题(含答案) .pdf
- 简单商铺租赁合同范本修订版.pdf
- 2025年-2025年福建省电工低压预测试题(含答案) .pdf
- 2025年-2025年社会工作者之初级社会工作实务过关检测试卷B卷附答案.pdf
- 2025年-2025年社会工作者之初级社会综合能力押题练习试题A卷含答案.pdf
- 十四五期间辽宁省智能装备产业发展趋势及行业投资可行性研究报告.docx
文档评论(0)