- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于《红楼梦》多语种译本数字化及网络检索平台建设的几点意见
关于《红楼梦》多语种译本数字化及网络检索平台建设的几点意见
西南交通大学外国语学院唐均
一、 中国古典小说及其译本数字化工作述略
中国古典小说译本的数字化工作基本上还处于相关建设的初级阶段,至于多语种译本的数字化
和网络检索几乎更是无从谈起。
中国古典小说原本的数字化工作,因为版本的歧异而显得比较复杂。最完备的语料库建设自然
是考虑将已有定评的各种版本搜罗殆尽,这项工作又涉及采用文字录入版本还是原件扫描版本的抉
择。一般地,文字录入版本便于搜检等复杂要求的处理,但对于不少较早版本而言,其中的部分电
脑未存字符会严重妨碍很多要求的处理,这样就只适应于受众面相对较广的一般读者要求。而原件
扫描版本能够完整保存各个不同版本的诸多原始信息——除了俗讹文字以外,有关版式、版面、批
注等外在信息在当今的技术条件下都能得到良好的存储和再现,但是不便于很多复杂查检功能的实
现,因此这种模式一般适用二F受众面较窄的专业读者群。
以我们熟悉的“四大名著”为例:《三国演义》的数字化工作相对开展得比较早,成果也比较丰
富(欧阳健2005:99—100)。《水浒传》多版本的数字化工作基本可以实现多个不同版本之间的文字
比对工作(周文业2009)。但是这两部古典小说的译本在数字化方面似乎朱见比较深入的进展①,与
其原本数字化jf作的深入远远不能相称。绍兴文理学院开发建设了“《西游记》汉英平行语料库”圆,
以詹纳尔(W.E
似乎还要滞后一些。
另外附带说明一下:“四大名著”之外影响颇大的《金瓶梅》其实各种语言的译本更为繁多,对
外国人的文化影响也更为显著和深入,但无论是原本还是译本的数字化工作,迄今尚未查得任何可
靠的信息。
二、 《红楼梦》及其译本数字化工作的进展
早在20世纪中期,瑞典著名汉学家高本汉(BernhardKarlgren)曾经使用人工概算方式对《红
楼梦》的某些语言结构单位进行数理统计以便深入研究(陈文新等2005:120),这似乎可以看成是
《红楼梦》数字化工作的遥远先卢。而美籍华裔学者陈炳藻可能是最早开始利用计算机对《红楼梦》
面的工作,而以文本语言单位的统计分析为主要研究手段;由于当时尚未出现网络技术,所以这种
今天已经非常普及的交互式文献共享方式在当时完成还不可能思及。
目前,三种《红楼梦》版本(甲戌本、庚辰本、程乙本)业已以GBK简体字标点整理本、Unicode
繁体字原貌本和原版图像扫描本三种形式予以数字化了(孟彦2007:317_318)。总的来看《红楼
1),这为多语种译本的数字化和网络检索提供了
梦》原本数字化工作已有充分的进展(曹立波等201
传》的汉英文本iF行对照(《三国演义》的英译奉使用C.H.Brewitt.Taylor译本).
。目前这个语料库已经在网上发布:http.//corpus.usx.edu.en/xiyouji/index.asp。
@他有论文(从词汇上的统计论《红楼梦》的作者问题)(1980)、(电脑在文学上的应用:‘红楼梦》与‘儿女英雄传’
两书作者用词的比较)(1986)以及专著‘电脑红学:论(红楼梦)作者》等。
274
关于《红楼梦》多语种译本数字化及网络检索平台建设的几点意见
有效的技术和语料支撑。
目前,系统的《红楼梦》泽本数字化』:作主要集中在汉英平行语料库的建设和利用方面,目前
已知的有如下三个各自独立的体系——
--)‘红楼梦》四个英文译本的数字化工作(燕山大学刘泽权等负责开发):
《红楼梦》中英文平行语料库的创建分为以下几个步骤(刘泽权等2008:328)——(1)语料
库的设计; (2)文本收集;(3)双语语料的预处理;(4)建立等价单位的索引;(5)等价单位
的自动抽取; (6)数据统计分析;(7)语料检索试用;(8)出版语料光盘及检索软件;(9)开
通基于互联网的检索平台。其中的主要问题集中在语料选择、文本校对、属性标注、句型界定及软
件选择与运用等方面(刘泽权等2008:328)。
这个中英平行语料库的开发和初步应用已有专著加以总结(刘泽权2010),但是据说以此二传提
供的信息为依据进行的计算机处理实际上还不能达到预期效果。
文档评论(0)