基于平行语料库翻译研究述评.docVIP

基于平行语料库翻译研究述评.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于平行语料库翻译研究述评

基于平行语料库翻译研究述评   摘要:基于语料库的实证研究克服了以往规范性研究的主观性和局限性,可充分地观察和发现更多的语言事实,从而充分地描写和解释。本文探讨了平行语料库的概念及其特点,介绍了目前世界上几个用于翻译研究的重要平行语料库,最后对平行语料库和基于平行语料库的翻译研究进行了述评。   关键词:平行语料库; 译文; 翻译过程; 翻译研究   中图分类号:H159 文献标识码:A 文章编号:1004-0544(2009)05-0137-04      一、 前言   语料库语言学在20世纪90年代再次兴起和描述性翻译研究的发展使得这种基于语料库的翻译研究作为一种新的研究范式受世人瞩目。基于语料库的实证研究克服了以往规范性研究中的个人主观性和局限性,可以充分地观察和发现更多的语言事实,从而充分地描写和解释。用于翻译研究的语料库有三种:平行语料库、多语语料库和可比语料库。本文专门讨论平行语料库和基于平行语料库的翻译研究。      二、 平行语料库的概念及其特点   何谓平行语料库?语法学家众说纷纭,莫衷一是。John Sinclair(1996)认为,平行语料库是一组文本,每种文本除其自身外还有一种或一种以上的译语文本,最简单的平行语料库涉及两种语言文本――原文和译文。有些语料库存在几种语言文本,翻译方向也不固定,有些文本从甲语译为乙语,或从乙语译为甲语,翻译方向并不清楚。Olohan(2004:24)指出平行语料库是指在语料库里含有一种语言的一组文本及其另一种语言的译文。可是,Johansson(1998)对此不与苟同,他认为这与其说是“平行语料库”,倒不如称之为“翻译语料库”,因为平行语料库通常用来指那种可比的一组双语文本而非译文。然而,目前大家普遍认可的观点是,平行语料库有单/双向、双语/多语之分,单向是含有指甲语的原文与乙语的译文;双向是指含有甲语的原文与乙语的译文和乙语的原文与甲语的译文。后者的构成表明语料库含有可比语料库的成分。同时,平行语料库既可以是双语的,也可以是多语的,即甲语的原文与乙、丙、丁语的译文(Olohan,2004:24-25)。      三、 用于翻译研究的几个重要平行语料库特征解析   英语-挪威语平行语料库(ENPC)作为监控语料库含有可比语料,该库不仅含有英语原文及其挪威语译文,而且含有挪威语原文及其英语译文。其库容为260万词次,文本为小说和非小说体裁。按照TEI标准对文本的参考文献信息和文本类型、文本章节、段落和句子边界的划分等进行了标注。原文和译文都经过句子自动对齐,然后进行人工纠错。英语文本采用POS标注,然而由于缺乏挪威语标记系统,挪威语文本没有经过POS标注(Olohan,2004:56-57)。   Zanettin(2000:108-109)提到英语-意大利语翻译语料库(CEXI)是以ENPC为蓝本建成的,含有已出版的书面语书籍及其译文,该语料库属于双语双向语料库,含有意大利语原文及其译文和英语原文及其意大利语译文,这表明它含有可比语料库的成分。其收录的书籍文本可细分为:小说和非小说两种类型,两者都不含儿童文学,其库容为400万词次。   德语-英语文学文本平行语料库(GEPCOLT)设计建造的主要目的是调查翻译中的标准化(normalization)和创造性(creativity)。尽管研究人员在分析中用到了德语和英语参考语料库,但是它并不包含可比语料库的成分。由于在文本作者性别、小说类型等平衡方面难度较大,所以GEPCOLT含有女性作家的原文而译者大多是男性。该语料库含有翻译英语语料库(TEC)中以文本附加信息(header files)方式存储的有关文本出版和翻译过程的语外信息(Olohan,2004:58-59)。   英语-瑞典语平行语料库(ESPC)以ENPC为蓝本,兼有可比语料库和翻译语料库的特点,即既有英语源文及其瑞典语译文,也有瑞典语源文及其英语译文。两种语言的源文在文本类型、主题、目的和语域等四个方面相匹配。目前,现版本的ESPC含有64个英语文本及其瑞典语译文,72个瑞典语文本及其英语译文。文本范畴为小说和非小说。文本本身的标注同ENPC一样遵循TEI的标码规则,文本的语外信息采用文本附加信息方式标注(Olohan,2004:57)。   巴比英语-汉语平行语料库(The Babel English-Chinese Parallel Corpus)是由英国Lancaster大学的语言学家建造的单向平行语料库,该库含有327篇英语源文及其汉语译文,库容为544,095词次。英语和汉语文本都作了词性标注,语料库对齐采用句子对齐方式,先利用电脑软件进行自动对齐,然后进行人工纠错。通过基于网络的对齐索性软件用户可从网上免

您可能关注的文档

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档