- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
机器翻译的终极之路在哪里(下)
编者按:据不完全统计,世界上现存语言超过7000多种,即使人類不眠不休穷尽一生也只能掌握几十种语言。于是,很多科学家开始思考如何用机器来帮助人们解决沟通问题,因此机器翻译应运而生。那么,什么是机器翻译?机器翻译是如何发展的?目前还有哪些应用呢?接下来,我们将共同了解这些内容。
倪俊杰?浙江省桐乡市凤鸣高中
刘宗凡?广东省肇庆市四会中学
邱元阳?河南省安阳县职业中专
金?琦?浙江师范大学附属中学
杨?磊?天津市第五中学
邵建勋?浙江省义乌市上溪中学
神经网络机器翻译模型
倪俊杰:据相关新闻报道,神经网络机器翻译(NMT)与其他机器翻译技术相比,可以使翻译质量提升30%,同时解决了远距离语言的复杂性问题。那么,关于神经网络机器翻译的模型,还有哪些值得关注呢?
杨磊:这里我来着重介绍一下神经网络机器翻译的模型。人类语言可以表示为时间序列数据,即指在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度,后面的数据跟前面的数据有关系。由于RNN可以有效地处理时间序列数据,所以,自然语言处理的各个领域越来越多地使用RNN。编码过程就是利用RNN将输入的一段文字转换成一系列数字,用这些“特殊”的数字来表征非常复杂的对象(一句话或一段文字)。这样比较两种不同的语言就相对容易了,因为我们只要去比较那组“特殊”数字就可以,不需要比较完整的文字。我们可以再用另一个RNN,把这些数字再次转换,转换后的结果可以是输入的原句,也可以是其他的语言,甚至还可以是一张图片,这个过程的结果,取决于使用何种语料库(数据集)。模型通过训练网络获得编码和解码过程中的两个RNN的权值,最终构建出一个翻译网络,全过程如图1所示。GNMT利用深度学习方法不依赖于对人类语言规则的了解,模型本身清楚这些规则,这意味着不需要专家调整翻译流程中的步骤,计算机就能做到这些,更有趣的是,如果有合适的训练数据集,大部分序列到序列问题都可以采用该模型。
机器翻译领域还有很多优秀的模型,统计机器翻译(SMT)也是其中的佼佼者。SMT是首先为语言的产生构造某种合理的统计模型,根据统计模型,定义模型参数,并设计参数估计算法,也就是把翻译当成统计几率,利用平行语料,然后逐字进行统计。例如,机器虽然不知道“病毒”的英文是什么,但是在大多数的语料统计后,会发现只要有“病毒”出现的句子,对应的英文例句就会出现“virus”这个词。
最新的研究用生成对抗网络(GAN)与神经机器翻译(NMT)两者结合到一起提出了一种新的框架Adversarial-NMT,也得到了很好的实验效果。相信,随着研究的不断深入和商业领域的创新实践,机器翻译将会给我们的学习生活带来更多惊喜。
在线翻译网站应用
倪俊杰:语言的魅力,有时候连人类都无法参透,更何况是机器翻译呢?既然机器翻译是靠技术支撑的,那么技术的选择或者算法优劣也会对翻译的效果产生影响。目前市面上做机器翻译的企业非常多,具体哪家最好,到底该如何分辨呢?
准确、优美的翻译,是人工智能的终极目标之一。目前的机器翻译虽然取得了长足进展,但离准确、优美还有很长的一段路要走。我们用目前最流行的几个在线机器翻译系统来翻译一段《鲁滨孙漂流记》中比较简单的文字,至于翻译结果的正确性和可读性,留给读者自己来评论。图2~图5分别是百度、谷歌、金山词霸、有道翻译的结果,下面这段是人工翻译:
Ihadtwoelderbrothers,oneofwhomwaslieutenant-coloneltoanEnglishregimentoffootinFlanders,formerlycommandedbythefamousColonelLockhart,andwaskilledatthebattlenearDunkirkagainsttheSpaniards.WhatbecameofmysecondbrotherIneverknew,anymorethanmyfatherormotherknewwhatbecameofme.(我有两个哥哥,大哥是驻佛兰德的英国步兵团中校。著名的洛克哈特上校曾带领过这支部队,大哥是在敦刻尔克附近与西班牙人作战时阵亡的。至于二哥的下落,我至今一无所知,就像我父母对我后来的境况也全然不知一样。)
除了在线翻译系统,机器翻译在同声传译方面也逐渐进入实用性阶段,为人们出国旅游、学习外语等提供了极大的方便。科大讯飞公司的“讯飞翻译机”目前已经可以实现粤语、四川话、东北话、河南话等方言和33种外语的实时翻译以及中英、中日、中韩、中俄四种语言的离线翻译。“搜狗翻译宝”“汉王翻译机”“小米、小爱
您可能关注的文档
最近下载
- 专题22.7 二次函数图象与系数的关系选填压轴专项训练(30道)(解析版).pdf VIP
- 浙江省嘉兴市第一中学2024-2025学年高一上学期10月阶段性测试物理试卷(含答案).pdf VIP
- 1.新版历年全国高考英语高频词汇必备表汇总打印版.docx
- 矿山生态修复技术规范第3部分:金属矿山.pdf VIP
- 〖地 理〗世界的地形第一课时说课稿-2024-2025学年七年级地理上学期(湘教版2024).docx VIP
- 《物理学发展史》课件.ppt VIP
- 《物理学的发展史》课件.docx VIP
- 2026秋季中国电建集团北京勘测设计研究院有限公司校园招聘笔试参考题库附答案解析.docx VIP
- 浙江省嘉兴市2023-2024学年高一上学期10月月考物理含解析.pdf VIP
- 美国特色介绍.pptx VIP
文档评论(0)