关于《红楼梦》多语种译本数字化及其网络检索平台建设的几点意见.pdfVIP

关于《红楼梦》多语种译本数字化及其网络检索平台建设的几点意见.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于《红楼梦》多语种译本数字化及网络检索平台建设的几点意见 关于《红楼梦》多语种译本数字化及网络检索平台建设的几点意见 西南交通大学外国语学院唐均 一、 中国古典小说及其译本数字化工作述略 中国古典小说译本的数字化工作基本上还处于相关建设的初级阶段,至于多语种译本的数字化 和网络检索几乎更是无从谈起。 中国古典小说原本的数字化工作,因为版本的歧异而显得比较复杂。最完备的语料库建设自然 是考虑将已有定评的各种版本搜罗殆尽,这项工作又涉及采用文字录入版本还是原件扫描版本的抉 择。一般地,文字录入版本便于搜检等复杂要求的处理,但对于不少较早版本而言,其中的部分电 脑未存字符会严重妨碍很多要求的处理,这样就只适应于受众面相对较广的一般读者要求。而原件 扫描版本能够完整保存各个不同版本的诸多原始信息——除了俗讹文字以外,有关版式、版面、批 注等外在信息在当今的技术条件下都能得到良好的存储和再现,但是不便于很多复杂查检功能的实 现,因此这种模式一般适用二F受众面较窄的专业读者群。 以我们熟悉的“四大名著”为例:《三国演义》的数字化工作相对开展得比较早,成果也比较丰 富(欧阳健2005:99—100)。《水浒传》多版本的数字化工作基本可以实现多个不同版本之间的文字 比对工作(周文业2009)。但是这两部古典小说的译本在数字化方面似乎朱见比较深入的进展①,与 其原本数字化jf作的深入远远不能相称。绍兴文理学院开发建设了“《西游记》汉英平行语料库”圆, 以詹纳尔(W.E 似乎还要滞后一些。 另外附带说明一下:“四大名著”之外影响颇大的《金瓶梅》其实各种语言的译本更为繁多,对 外国人的文化影响也更为显著和深入,但无论是原本还是译本的数字化工作,迄今尚未查得任何可 靠的信息。 二、 《红楼梦》及其译本数字化工作的进展 早在20世纪中期,瑞典著名汉学家高本汉(BernhardKarlgren)曾经使用人工概算方式对《红 楼梦》的某些语言结构单位进行数理统计以便深入研究(陈文新等2005:120),这似乎可以看成是 《红楼梦》数字化工作的遥远先卢。而美籍华裔学者陈炳藻可能是最早开始利用计算机对《红楼梦》 面的工作,而以文本语言单位的统计分析为主要研究手段;由于当时尚未出现网络技术,所以这种 今天已经非常普及的交互式文献共享方式在当时完成还不可能思及。 目前,三种《红楼梦》版本(甲戌本、庚辰本、程乙本)业已以GBK简体字标点整理本、Unicode 繁体字原貌本和原版图像扫描本三种形式予以数字化了(孟彦2007:317_318)。总的来看《红楼 1),这为多语种译本的数字化和网络检索提供了 梦》原本数字化工作已有充分的进展(曹立波等201 传》的汉英文本iF行对照(《三国演义》的英译奉使用C.H.Brewitt.Taylor译本). 。目前这个语料库已经在网上发布:http.//corpus.usx.edu.en/xiyouji/index.asp。 @他有论文(从词汇上的统计论《红楼梦》的作者问题)(1980)、(电脑在文学上的应用:‘红楼梦》与‘儿女英雄传’ 两书作者用词的比较)(1986)以及专著‘电脑红学:论(红楼梦)作者》等。 274 关于《红楼梦》多语种译本数字化及网络检索平台建设的几点意见 有效的技术和语料支撑。 目前,系统的《红楼梦》泽本数字化』:作主要集中在汉英平行语料库的建设和利用方面,目前 已知的有如下三个各自独立的体系—— --)‘红楼梦》四个英文译本的数字化工作(燕山大学刘泽权等负责开发): 《红楼梦》中英文平行语料库的创建分为以下几个步骤(刘泽权等2008:328)——(1)语料 库的设计; (2)文本收集;(3)双语语料的预处理;(4)建立等价单位的索引;(5)等价单位 的自动抽取; (6)数据统计分析;(7)语料检索试用;(8)出版语料光盘及检索软件;(9)开 通基于互联网的检索平台。其中的主要问题集中在语料选择、文本校对、属性标注、句型界定及软 件选择与运用等方面(刘泽权等2008:328)。 这个中英平行语料库的开发和初步应用已有专著加以总结(刘泽权2010),但是据说以此二传提 供的信息为依据进行的计算机处理实际上还不能达到预期效果。

文档评论(0)

whl005 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档