机器翻译的终极之路在哪里(上).docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

机器翻译的终极之路在哪里(上)

编者按:据不完全统计,世界上现存语言超过7000多种,即使人类不眠不休穷尽一生的力量也只能掌握几十种语言。于是,很多科学家开始思考,如何用机器来帮助人们解决沟通问题,因此机器翻译应运而生了。那么,什么是机器翻译?机器翻译是如何发展的?目前还有哪些应用呢?接下来,我们将共同来了解这些内容。

什么是机器翻译

机器翻译技术的发展历程

机器翻译的原理并不简单,其发展历程也是由浅入深的。随着计算机技术和语言学的快速发展,机器翻译的方法也在更新迭代(如图2)。大致可以分为三种类型,分别是基于规则的方法、基于统计的方法和基于神经网络的方法。

1.基于规则的方法

2.基于统计的方法

总的来说,统计机器翻译的主要优点是不需要像基于规则的机器翻译一样,针对每个语言打造专门的翻译引擎,只要收集足够多的文本,就可以训练针对任何语言的通用翻译引擎。统计机器翻译的主要缺点是在翻译训练语料库中没有相似的资料文本时,不能得到准确译文。统计机器翻译通常不能生成高质量的文本,它经常在不顾及上下文联系的情况下翻译原文,而且译文语序往往不对。相比基于规则的方法,基于统计的方法成本较低,因为它和语言没有关系,一旦翻译模型建立以后,其翻译知识来自于大数据的自动训练。因此,在基于统计的机器翻译中,语言模型的建立至关重要,因为语言模型是衡量一个句子在目标语言中是不是流利和地道的关键,计算机可以使用翻译模型来“计算”如何将文本从一种语言转换为另一种语言。

基于统计的机器翻译的主要产品提供商有BeGlobal(SDL)、GoogleTranslate、MicrosoftBingTranslator、Moses等。其中GoogleTranslate是谷歌基于自有的翻译引擎和研究技术,提供的免费在线翻译服务。Moses是一个开源的统计机器翻译引擎,它已被业界广泛应用于构建定制的机器翻译引擎。

3.基于神经网络的方法

从图4中可以看出,从基于统计的方法到基于神经网络的方法,翻译能力可以提升到60%以上,这是极大的进步。相比基于规则和统计系统,基于神经网络的结构使系统更自适应,能处理更多更复杂的模型。它也可以根据经验自我学习,如果它提供了不正确的输出,它能从错误中吸取教训,并做出调整,以便下次更有效地执行任务。

机器翻译在生活中的应用

机器翻译的快速发展,在很多领域得到了广泛的应用。机器翻译技术的进步和系统性能的提升在为人们日常生活和工作带来更多便利的同时,也为该技术的产业化发展带来了更多商机。关于机器翻译的基本应用,大致可以分为三大场景:信息获取为目的的场景、信息发布为目的的场景、信息交流为目的的场景。以信息获取为目的的场景,可能大家都比较熟悉,如翻译或是海外购物,遇到一些生僻的词就可以借助机器翻译技术,来了解它的真正意思。在信息发布为目的的场景中,典型的应用是辅助笔译,比如起草一份文件需要多国语言的版本,就需要用到机器翻译技术了。以信息交流为目的的场景,主要解决人与人之间的语言沟通问题,如同声传译等。接下来,我们来看一些比较有意思的应用。

1.特殊中文翻译

机器翻译除了能做多国不同语言的翻译之外,还可以在中文方面做一些有意思的事情。中文博大精深,源远流长,文言文就是很有中國特色的语言表达方式。在百度翻译中,实现了输入白话文后,就能输出文言文的效果(如图5)。

2.同声传译设备

什么是同声传译?其实可以分解开来看,“同”表示时间延迟要短,在说话的同时基本上翻译结果就传递出来;“声”是指用到的是语音技术,包括语音识别和合成;“传”就是信息传递要准确,得把原本的意思准确地表达出来;“译”就是翻译技术,对应到机器翻译。同声传译设备是实现高级别国际会议同步翻译不可缺少的系统设备,通过该设备可以保证演讲者在演讲的同时,内容被同声翻译成指定的目标语言。随着当前社会现代化进程的不断推进以及人们生活水平的提高,同声传译已经不仅仅是高端需求,普通民众在出国旅游或者商务洽谈的时候也会有此类需求。在某购物网站搜索“同声传译器”,价格从几百到几千不等,款式有手持式、头戴式,也有耳机式。点开某热销款同传翻译设备,可以看到如下介绍:支持59种语言,可以实现0.5秒快速翻译,中英文离线翻译也能达到大学英语六级水平(如图7)。

文档评论(0)

fdfdsos + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7100020006000001

1亿VIP精品文档

相关文档