- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器翻译句法错误分析
对机器翻译的研究从20世纪40年代第一台计算机诞生至今,无论在理论研究方面还是工程实践方面都已经积累了丰富的经验。随着计算机和因特网的普及,机器翻译已经得到广泛推广,产生了巨大的社会效益和经济效益。中国的改革开放也给中国翻译服务提供了巨大的市场,市场对翻译的巨大需求再一次激起人们对机器翻译研究的强烈兴趣。一、 机器翻译的适用范畴
“计算机翻译不适用于文学性很强或文化味很浓的文本,而适用于科普文献、金融商业交易、行政管理备忘录、法律文件、说明书、农业及医学资料、工业专利、宣传册、报纸报道等”[2]5。1976年加拿大蒙特利尔大学和加拿大联邦政府翻译局联合开发的“天气预报”英-法机器翻译系统TAUM-METEO成为在受限语言内机器成功翻译最早的一个例证。为在全球范围内推销其产品和服务,让国外用户能够读懂其产品说明书和用户手册等技术文件,降低语言转换成本,欧洲航空航天工业协会也为其文件中使用的英语限定了985个术语和60条写作规则[3]。
“十五”期间,中国科学院计算机研究所对我国现有的机器翻译系统进行了测评,结合机器翻译系统对诗歌、散文、小说、剧本和受限语言等不同体裁、不同风格的文本翻译,在对译文进行具体分析、对比和综合评价的基础上,确定了英汉机器翻译在受限语言处理中取得了最高的5级适用级别和85%以上的可翻译度[6]131162。机器翻译取得的成就与受限语言的五大基本特征密切相关,其常用性、有限性、简明性、单义性和规范性[1]10可以大大简化基于某一受限语言范畴的机器翻译规则的制定。由此可见要提高机器翻译的译文质量,在受限语言范畴内展开机器翻译研究应该是行之有效的方法。二、 机器译文句法错译研究的方法和目的
基于对机器翻译适用范畴的研究成果,《机器翻译后译文编辑模式研究》项目选择了同济大学汽车学院的“汽车技术文献翻译语料库”中某一知名品牌汽车操作手册作为研究对象,在这一限定专业范围内,由人工对英语原语、其机器译文和人工译文十万句对展开了句子一级的平行对比研究。语料中的机器译文由“华建机器翻译系统”(中国科学院计算机语言信息工程研究中心研发)生成获取,人工译文来源于同济大学汽车学院资料翻译研究所专业技术人员。
本文将对机器译文中出现的句法错误加以描述和分析,从纷繁复杂的语言现象中寻找和归纳出机器在汽车技术文献这一受限专业领域内进行翻译处理时表现出的句法错误特征,为翻译系统补充建立形式化的句法规则提供语言基础,最终提高机器翻译的质量。罗季美:机器翻译句法错误分析三、 机器译文句法错误的统计和主要表现形式
《机器翻译后译文编辑模式研究》课题组在完成1000句抽样对比基础上归类设定了机器在词序、名词短语、动词短语、介词短语、被动语态、不定式短语和分词短语翻译处理上可能出现的七类句法错误[4]。在对句法错误进行标注和统计中发现,词序错译表现最为复杂,错译率在各类句法错译中高居榜首,达到29.35%[5]。但因词序错译与机器对名词短语、动词短语、介词短语、被动态、不定式短语和分词短语等的错误处理存在很大的交错,以下不再将词序错译作为单独的错误形式进行讨论。此次译文对比也发现,机器对被动语态的翻译处理达到了很高的准确性,对被动语态的错译主要表现在机器对动词不定式中被动语态的处理上,以下将在不定式短语错译中讨论被动语态错译。撇开词序错译和被动语态错译,我们得到了表1所示的机器译文五类句法错译发生率。错译率为出现某类句法翻译错误的机器译文总句数/机器译文的总句数×100%。对同一句子中多次出现的同一类型句法翻译错误进行一次标注和统计;对同一句子中出现的不同类型句法错误分别加以标注和统计。
表1机器译文五类句法错译发生率
以下将根据机器译文句法错误的分类,结合统计结果,举例对语料对比中出现的机器译文典型句法错误加以描述、归纳和分析。在所举各例中,A句为机器译文,B句为人工译文。另外,为了使译文的对比更方便清晰,在所给例句中,每次只对所述的单一句法错译类型进行比较,并用下划线以示区分。
1. 名词短语错译
为了追求语言的简练,科技英语中大量使用名词短语,名词短语错译在整个语料中达到695%。错译主要发生在对结构比较复杂的名词短语进行翻译时,如以下两例。
Install the new service hole cover.
A:安装洞包括的新服务。
B:安装新的检修孔盖。
此例中的名词短语 “the new service hole cover”由形容词“new”+起修饰作用的名词短语“service hole”+名词“cover”构成,人工译文表现出了与原英语词序完全相同的顺序,将其译为“新的检修孔盖”。机器对“cover”词性的错误判断,对其
文档评论(0)