机器翻译面临的语义分析难题在日译汉翻译中的体现.docxVIP

机器翻译面临的语义分析难题在日译汉翻译中的体现.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

?

?

机器翻译面临的语义分析难题在日译汉翻译中的体现

?

?

李佳钰

摘要:在机器学习和自然语言处理技术支撑下,机器翻译取得了飞速发展。但机器翻译依然面临语义分析这一难题,本文旨在通过分析机器翻译的错误译文,总结语义分析难题在日译汉翻译中的体现。

关键词:机器翻译;难题;语义分析;日译汉

一、引言

基于计算机技术、自然语言处理技术和机器学习算法的不断发展,机器翻译不断革新,取得了巨大的成果。[1]随着跨语言、跨文化交流的扩大和深化,机器翻译正逐渐成为实现沟通交流、跨越语言障碍的重要手段,有效降低了沟通成本,在教育、社交、商业贸易、文化交流等领域内都有广阔的应用空间。

当前的机器翻译方法无论是基于规则的机器翻译方法、基于统计模型的机器翻译方法、还是基于神经网络的机器翻译方法,依然面临语义分析这一绕不开的难题,本文以心境小说《在城崎》的原文和百度翻译的错误译文为例,分析语义分析难题在日译汉翻译中的具体体现。

二、机器翻译方法和语义分析难题

当前的机器翻译方法,大致有基于规则的机器翻译方法、基于统计模型的机器翻译方法、基于神经网络的机器翻译方法。基于规则的机器翻译方法着重语言学知识,通过深层次语言学分析得出翻译规则,是较传统的翻译方法;基于统计模型的机器翻译方法将平行语料作为翻译知识的来源,通过大量分析平行语料库的内容,类比得出新内容最合适的翻译方式;人工神经网络本质上是受到大脑神经网络的启发而建立的数学模型。[2]2013年以后,基于人工神经网络的机器翻译逐渐兴起,在谷歌翻译开发并使用了Google神经机器翻译系统后,神经网络机器翻译正式进入运用阶段[3]。

自然语言具有的歧义特征使机器翻译面临语义分析这一大难题。歧义是自然语言中普遍存在的现象,实质是同一语言形式可能具有不同的意义。自然语言在词汇、句法、语义、语用等各个层面都充满歧义。在词汇层面上出现一词多义;句法层面上一个句子可以表示多个意思,即句子本身是歧义的。[4]机器翻译集成了自然语言处理学科中各个分支的诸多难题,由于词形、词性、句法、语义都存在着不同程度的歧义,使得机器翻译面临重大难题。[5]

现有研究显示,基于规则的机器翻译方法通过构建自然语言之间的转换规律进行翻译,难以解决语义分析难题。基于统计模型的机器翻译方法依靠大量语料,通过数学模型描述自然语言的转换过程,将传统基于规则的机器翻译难以解答的“语义问题”交由数据和统计解决。基于神经网络的机器翻译方法使用深度学习神经网络获取自然语言之间的映射关系,绕开了“语义问题”并使“语义理解”的过程成为“黑箱”。[6]当前的机器翻译从产出效果上来讲已经取得了很大的进步,但无论是基于统计模型的机器翻译方法还是基于神经网络的机器翻译方法,都只是盡力实现得出正确译文的概率最大化,语义分析依旧是不能也无法绕开的难题[7]。

三、语义分析难题在日译汉翻译中的体现

机器翻译面临的语义分析难题在日译汉翻译中有多种体现。下文通过日本作家志贺直哉的心境小说《在城崎》中的原文与目前国内知名度较高的在线翻译平台百度翻译的译文为例,分析语义分析难题在日译汉翻译中的体现。

(一)多义词、多义句型翻译。

多义性是自然语言的特点之一。多义词和多义句型的翻译需要在语义分析的基础上选取适当的义项。

(1)原文:子供が二三人、四十位の車夫が一人、それへ石を投げる。なかなか当らない。

百度翻译:有两三个孩子,一个四十多岁的车夫向他扔石头。很难猜中。

正确翻译:两三个孩子和一位四十多岁的车夫向它扔着石头。总是打不中。

「当たる」有“猜中;击中;中奖”等多个义项,文中的意思应为“(石头)击中,打中”。

(2)原文:寂しい秋の山峡を小さい清い流れについて行く時考える事は矢張り沈んだ事が多かった。

百度翻译:在寂寞的秋天的山峡里,随着小清澈的河流前进的时候,思考的事情还是很多的。

正确翻译:沿着小溪行走在寂静的秋季峡谷中,此时此刻想的也多是令人心情沉郁的事。

「について」在本句中是“沿着”的意思。

(二)代名词翻译。

在译文中正确将代名词指代的内容表达出来,需要对原文进行语义分析。

原文:自分は自身で病院をきめた。それへ行く方法を指定した。

百度翻译:我自己决定去医院。我指定了去那个的方法。

正确翻译:我自己决定了去哪个医院,并指定了去医院的方法。

代名词「それ」在文中指的是“医院”。

(三)划分句子层次。

当某些假名汉字组合在一起,能够通过不同的层次划分方式判断成不同的句型时,需要在语义分析的基础上正确划分句子层次,进而判断句子应用的句型。

原文:或所迄来ると橋だの岸だのに人が立って何か川の中の物を見ながら騒いでいた。

百度翻译:到了某个地方,明明是桥或岸边却站着人,一边看着河里的东西一边吵闹着。

正确翻译:走到某个地方,只见桥上和岸边挤满了人,一边看着河里的

文档评论(0)

lookoudb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档