机器翻译技术的探讨.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器翻译技术的探讨机器翻译技术的探讨

机器翻译技术的探讨 六院五队-徐允鹏 摘要 随着国际交流的日益增多,在计算机、互联网等相关技术日新 月异的基础上,机器翻译的技术与应用得到了蓬勃发展。本文详细探 讨了基于规则的机器翻译方法、基于语料库的机器翻译方法和混合式 机器翻译方法,并讲述了机器翻译的评估方法,最后介绍了机器翻译 技术的最新进展。 关键词:机器翻译;基于规则;语料库;评估方法 1. 机器翻译概述 随着国际化交流的普遍性,信息通信的日益膨胀,高效的处理不 同领域各种语言之间的互译已成为当代人们的普遍需求。翻译是解决 自然语言之间通信障碍最直接最有效的方法。传统的翻译工作都是通 过专业翻译人员完成,利用语言学知识进行自然语言之间的互译,帮 助人们实现信息通信。伴随着计算机技术的成熟与自然语言处理技术 的不断进步,利用机器翻译系统帮助人们快速获取外文信息代替人工 翻译已成为一种必然的趋势。 机器翻译(machine translation),又称为自动翻译,是利用计算 机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然 语言之间句子和全文的翻译。它是自然语言处理 (Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics )、 自然语言理解( Natural Language Understanding) 之间存在着密不 可分的关系[1]。 机器翻译是 21 世纪要解决的科技难题之一,主要困难是自然语 言在各个层次上的歧义性。研究机器翻译具有重要的实践意义和理论 意义。国际间的合作与交流,语言的差异是一个非常重要的障碍,各 行各业的人们面对大量他们不熟悉的语言的文档资料,如果单纯的依 靠人工翻译,这些日益的待翻译材料将是一种非常沉重的负担,而机 器翻译可大幅度减轻这种负担。同时,机器翻译对于了解人类语言和 思维的基本机制,探讨人工智能技术有着重要的意义。 2. 机器翻译方法 人们一直在寻求更好的解决机器翻译问题的方法,目前机器翻译 方法主要有基于规则的机器翻译,基于语料库的机器翻译和混合式机 器翻译方法。 2.1 基于规则的机器翻译方法 2.1.1 基于分析和转换的机器翻译方法 人作翻译时,把一个源语言句子译成目标语言句子,设计到四个 基本操作:目标语言单词的检索、调序、删词、增词;机器翻译系统 的过程包括检索、分析、转换和生成主要四个阶段,这被称为基于分 析和转换的机器翻译系统,也被认为是模拟人类翻译活动最恰当的机 制[2]。 该方法有三个阶段,为分析—转换—生成。一般情况下,分析以 句法为主、语义为辅,正确的句法结构转换加正确的词汇译文可以从 源语言向目标语言传递完整的正确信息。以句法结构转换附加一定的 语义信息, 能够构成转换的基本层次[3]。标准机器翻译系统中句子和 短语层次的结构转换是核心,产生式方式的转换规则形式为: S:S1+S2+···Si C1 C2···Ck T1+T2+···Tj :T S 是源语言的某个待翻译单位(句子、短语等等), S1~Si 是 S 中的下一级组成单位对于 S,如果满足条件C1 C2···Ck, 则目标 语言中有 T1~Tj 译文构成了相应的等价物 T。 上述方法称为基于句法的转换方法, 因为 S1+S2+···Si 一般来 说就是源语言的的句法结构表示:也可以称为直接转换方法, 因为对 于每个源语言的翻译组块, 都马上给出一个目标语言组块与之对应 应该说, 这种转换方法符合人的直觉认识, 也能够实现[3]。 2.1.2 基于中间语言的机器翻译方法 基于中间语言的翻译方法是对源语言进行分析以后产生一种称 为中间语言的表示形式,然后直接由这种中间语言的表示形式生成目 标语言。所谓中间语言就是自然语言的计算机表示形式的系统化,

文档评论(0)

ganqludp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档