- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
国内几种翻译软件AI同传及语音翻译质量评估分析
【摘要】AI同传的出现为翻译行业发展注入了新动力,同时也引起业内学者与专业译员们的极大关注:AI同传未来发展前景如何,翻译质量有无保证,能否取代人工翻译?此类讨论将研究者的视线聚焦在AI同传的核心技术——神经机器翻译上。在人工智能与大数据飞速发展的当今,越来越多的综合方法可应用于神经机器翻译技术的更新与完善。本文以3款融合AI技术的翻译软件为例,选取实用性原文素材为研究对象,参考权威口译质量评估标准,建立起一套评价标准,得出结论:AI同传及语音翻译译文仍未达到人工水平并存在较大差距,融合AI技术的神经机器翻译仍存在改进空间,如扩大语料库、增强学习功能与联想功能等。
【关键词】AI同传;神经机器翻译;口译质量评估
【作者简介】赵玉蓉,杨鑫,刘欢,龙玟月,杨茜,安超,阮先玉,西南石油大学。
【基金项目】本文由2019四川省级大学生创新创业训练计划项目“大数据背景下AI同传翻译质量研究”(201910615049)、西南石油大学第18期(2018-2019年度)课外开放实验重点项目(kSZ18c01)资助。
一、引言
自2016年起谷歌率先推出神经网络机器翻译系统NmT(NeuralmachineTranslation),机器翻译(machineTranslation)技术领域开始发生重大变革,机器翻译质量实现了大幅度提升。借助飞速发展的人工智能技术,国内各大互联网公司加快研發推广步伐,竞相推出融合了AI技术的翻译产品和服务。融合了AI技术且易获取的口译软件在得到广泛使用的同时也收获了大量反馈信息,无论是应用于口译实战,还是应用于大众生活,其翻译质量参差不齐,得到了褒贬不一的评价。
二、国内几种支持AI技术的翻译软件翻译原理——神经机器翻译(NeuralmachineTranslation,简称NmT)简介
神经机器翻译在翻译建模上不借用其他手段,只采用神经网络完成源语言到目标语言的转换。随着信息技术的进步、语言学理论的发展和人工智能技术的飞跃,引入神经网络的机器翻译对提高机器翻译效率和质量做出了重大贡献。但是,经典的机器翻译模型是一种通用的模型,并不完全针对机器翻译任务本身而设计,导致神经机器翻译仍然存在一些问题亟待解决。
三、研究方法
1.使用软件与素材。本文选用3种为大型会议提供过AI同传服务的翻译软件(腾讯翻译君、讯飞听见、搜狗翻译),人声录入原文,将软件译文与标准译文对照,进行初步分析。
本文选取的现场原文素材以及配套权威标准译文,内容涵盖国际会议演讲或致辞、历年政府工作报告、总理答记者问等。素材特点为:选词意义准确,表意清晰。多采用书面词汇、政治术语及复杂且长但逻辑性强的句式结构等,措辞严谨、精准,绝不会出现模棱两可、易生歧义等语句,文体正式化和语体口语化兼备的特点上。
2.分析理论——杨承淑的口译质量评估标准。台湾辅仁大学杨承淑提出的“量化”和“质化”理论是认可度较广的一种口译质量评估标准,评估项目及评分占比为:忠实(准确、完整)占50%,表达(明确、流畅)占30%,语言(语法、选词、风格)占20%,时间控制(原文与译文的时间比)以总分为基础上下浮动2%。由于该理论的对象为口译专业考试,在考试过程中时间有限的情况下,将时间控制一项纳入质量评估有一定的必要性。但在本项目研究中,对于时间控制没有过高要求,因此不做为重要评估标准参考。
四、译文质量分析
1.译文错误类型及译文质量量化表。为了确保译文对比质量,本团队前期先完成6期素材的录入、整理和分析,总结出几种频繁出现的错误类型。在完成译文错误类型归纳的基础上,参考杨承淑的口译质量评估标准,制定出一套适用于本研究的评分标准,采用扣分制,对10期译文打分。错误类型、扣分细则及评分表如表1所示。
2.无错句的案例。无错句分为零翻译、完全相同翻译和基本标准翻译。零翻译指原文不需要做翻译处理,译文只需与原文保持一致,本素材译文中不存在此情况。完全相同翻译指的是机器译文与标准译文完全相同,可直接采用的情况。基本标准翻译指的是机器译文虽然与标准译文基本相同,有修改的余地,但不做改动也能表意清晰顺畅的情况,亦可直接采用或稍做修改。
(1)完全相同翻译。
原文:中华人民共和国成立70周年。
标准:the70thanniversaryofthefoundingofthePeople’sRepublicofchina
三个软件:the70thanniversaryofthefoundingofthePeople’sRepublicofchina
(2)基本标准翻译。
原文:我们已经走上一条符合中国国情、适合时代要求的正确道路。
标准:wehaveembark
文档评论(0)