- 1、本文档共49页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据
万方数据
基于混合策略的汉藏机器翻译系统的构建方法研究
中文摘要
机器翻译作为意义等值下的自然语言转换,是指用计算机实现从一种 语言到另一种语言的翻译。机器翻译技术从上世纪 40 年代诞生后就受到世 界范围的广泛关注,由于机器翻译技术在很大程度上可以减少翻译人员的 工作量,因此,机器翻译技术已经成为信息科学研究的热点之一。
机器翻译系统可分为基于规则、基于统计和基于实例的方法。早期的 机器翻译系统基本上都采用基于规则的方法,具体可分为直译法、基于转 换的方法、中间语法三种方法,规则方法以语言学知识为知识源,以语言 间的转换为中心把源语言转换成目标语言,但该方法最大的问题在于单纯 依靠语言学家人工编写规则并不能满足实际应用的需要。从上世纪 90 年代 起基于统计的经验主义方法得到了快速发展,大规模语料库的出现促使基 于统计的经验主义方法成为目前自然语言处理技术的主流。此外,基于实 例的机器翻译方法也是研究的热点之一,该方法由日本著名机器翻译专家 长尾真提出,其基本思想借鉴了外语初学者学习的基本模式。
汉藏机器翻译研究起步较晚,始于 90 年代。早期主要使用规则方法,
青海师范大学藏文信息研究中心开发的 863 项目实用化汉藏机器翻译系统 就是在此基础上建立的。由于近年来统计方法的兴起,藏汉机器翻译也开 始尝试使用基于统计的方法,青海师范大学与中国科学院计算技术研究所 合作搭建了一个汉藏(藏汉)双向翻译系统。目前尚未有研究人员尝试将 混合策略用于汉藏机器翻译系统的研究和开发。本研究在汉藏机器翻译研 究中具有创新性和进步性,对今后的汉藏机器翻译方法研究提供一定的参 考价值。
本文通过介绍机器翻译的发展与现状,深入讨论了基于规则、基于实
I
例以及基于统计的翻译方法,分析了各自的优缺点,在此基础上结合基于
实例与基于规则的翻译方法,创建了汉藏对照词典库、实例库、模板库, 提出一种基于混合策略的汉藏机器翻译方法,设计实现了一个基于混合策 略的汉藏机器翻译系统。在今后的研究中以该系统为雏形,不断改进系统 结构,扩大语料规模,优化实例库和模板库,最终使该系统运用于实际。 本系统创建的词典库、实例库和模板库也可以为今后汉藏机器翻译相关领 域的研究提供可靠的数据资源。
关键词:混合策略,实例方法,规则方法,词典,短语模板库,汉藏机器 翻译
II
Construction of a Mixed Strategy Based Chinese—Tibetan Translation System
Abstract
Machine translation as natural language transformation under meaning equivalence, refers to using a computer to implement the translation from one
natural language to another natural language. The technology of machine translation has received an extensive worldwide attention after its birth in the 1940 s. The technology of machine translation can largely reduce the workload
of translator. Therefore, this technology has become one of the hot topics in the
study of information science.
Machine translation system can be divided into two broad categories, one based on rules and another one based on corpus. Thereinto, the method based
on corpus can be subdivided into statistical methods and instance methods. Early machine translation systems mostly use rule-based method which can be
roughly divided into three methods: literal translation method ,
conversion-based method and intermediate grammar
您可能关注的文档
- 基于机器视觉的纸张缺陷检测系统的研究-检测技术与自动化装置专业论文.docx
- 基于机器视觉的指针式仪表自动检测-运筹学与控制论专业论文.docx
- 钾铬砷体系分子轨道超导电性-凝聚态物理专业论文.docx
- 基于混沌映射的散列算法改进及其在密钥协商协议中的应用-模式识别与智能系统专业论文.docx
- 钾碱生产电解槽与蒸发器的计算设计-化学工程专业论文.docx
- 基于混沌映射的随机数产生器-模式识别与智能系统专业论文.docx
- 钾离子交换膜的制备与性能研究-海洋化学专业论文.docx
- 基于机器视觉的智能大输液异物检测系统的研究与设计-控制理论与控制工程专业论文.docx
- 基于混沌映射和DNA编码的图像加密-电子与通信工程专业论文.docx
- 钾离子筛膜应用性能研究-化学工艺专业论文.docx
- 2025年广西中考地理二轮复习:专题四+人地协调观+课件.pptx
- 2025年广西中考地理二轮复习:专题三+综合思维+课件.pptx
- 2025年中考地理一轮教材梳理:第4讲+天气与气候.pptx
- 第5讲+世界的居民课件+2025年中考地理一轮教材梳理(商务星球版).pptx
- 冀教版一年级上册数学精品教学课件 第1单元 熟悉的数与加减法 1.1.6 认识1-9 第6课时 合与分.ppt
- 2025年中考一轮道德与法治复习课件:坚持宪法至上.pptx
- 2025年河北省中考一轮道德与法治复习课件:崇尚法治精神.pptx
- 八年级下册第二单元+理解权利义务+课件-2025年吉林省中考道德与法治一轮复习.pptx
- 精品解析:湖南省娄底市2019-2020学年八年级(上)期中考试物理试题(原卷版).doc
- 2025年中考地理一轮教材梳理:第10讲+中国的疆域与人口.pptx
文档评论(0)