网站大量收购独家精品文档,联系QQ:2885784924

古籍整理中数字化技术原理与应用.docVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
古籍整理中数字化技术原理与应用.doc

古籍整理中数字化技术原理与应用 摘要:利用数字化技术实现古籍整理是本方向的发展趋势,本文针对古籍整理的数字化进程的基本原则和关键问题进行详细阐述,并提出古籍整理数字化应用的若干重要问题,为古籍整理的数字化实现奠定基础。 关键词:古籍整理 数字化 原理 应用 中图分类号: G258.33 文献标识码:A 1 引言 古籍整理是对古籍原文进行整理加工成为更贴近于现代的形式,使古籍中的内容更便于今人以及后人阅读和利用。然而古籍具有版本较多、完整性差,并且有的已失传的特点。此外,由于时间相隔之久,古籍中字词的意义与现代字词的意义已有较大区别。因此,利用或专研古籍内容就必须先对古籍进行梳理。更具体而言,以历代古籍为对象,依校勘、标点、注释、今译、辑佚、影印等为手段,通过运用版本、目录、校勘、文字、音韵、训话、考古等多种专业知识,所进行的整理加工活动,统称为古籍整理。其目标就是利用各种手段,尽最大可能的将古籍复原,保存其原本表述的内容,并且让现代人更容易理解[1]。 所谓数字化就是把人们常用的文字符号转化为数字符号,也就是说把传统的语言文字表达形式改变为计算机能识别的数字表达形式。而古籍数字化则就是把古代常用的文字符号转化成为计算机可以识别的数字符号的一种过程。从表层上看,这一过程使得古籍的存在形式发生了变化,而实际上也使得人们对古籍使用环境发生了相应的改变。 古籍是中华民族的文化瑰宝,也是实现数字化内涵的信息之源,把古籍信息数字化,可以将目前的古籍整理与研究引入到一个新的里程。这种操作方式的改变,不仅包含了传统的旧学,而且还涵盖着当代新型的科学技术,其功能具有时代性。而古籍应用环境的改变亦造就了汉学革命性的变化[2]。 2 古籍整理数字化进程中的基本原则与关键问题 2.1 基本原则 2.1.1 保真原则 古籍作为不可再生的文化资源,它的价值表现在两个方面:文物价值与文献价值。针对文物价值,将其数字化时应当遵守保真原则,越高的保真度才能提高文物的实际价值。古籍的载体有龟甲、兽骨、金石、简犊、绢帛、纸等等,这些实物易腐朽,且保存需占据较大空间,制作副本也十分复杂。数字化技术就可以完美的解决这一劣势,通常采用照相、扫描等方法将原来的载体及所载文字内容制成图像版[3]。如对铜器铭文,可用多媒体技术整体保存铜器的原貌,包括形状、色彩、图文、尺寸大小等,也可多角度摄影,展示某一局部的特征,甚至于某一字形的特写。 然而文字版的古籍数字化时,会失去原书的实体讯息[3],如原版的纸张质感、页面图腾、书法样式等,虽然这些问题亦可利用影像科技弥补一些,但终究是一本虚拟的实物。并且,为了方便后人对古籍内容的检索,我们会认为的对其界定属性,如分类属性、索引词等等。所以说,古籍数字化的保真性原则只是相对的,它允许在基本保真的前提下适当作一些加工处理,也就是辅以整理性的原则。 2.1.2 整理原则 古籍的文献价值在于它的资料性。人们重视的是其内容,只要内容真实,形式可以根据条件作适当的处理。也就是说,将古籍作为文本数字化的时候,应遵循以整理原则为主。古籍整理的重点是文字,古籍中涉及诸多的通假字、形声字、繁体字,加之长期流传过程的抄录与翻刻,给现代读者的阅读理解和应用带来了极大的困难。如果此时将古籍转化成电子化形式且不加修订的话,势必给读者的阅读带来障碍。在特定目的和统一原则下尝试部分保真应该是可以的,那必须结合整理原则来进行,通过对纷繁复杂的文字现象的归类整理,在总体上达到某种程度的保真。 2.2 关键问题 2.2.1字符集 古籍数字化首先要解决古籍进入计算机的问题。也就是说,让古籍中的汉字成为计算机可以处理的信息。古代汉字不仅要在显示器上显示出来或在打印机上打印出来,还要能够参与信息处理和通过网络进行信息交换。这取决于字符集中是否包括了古代的汉字。字符集的问题仍然需要投入相当的精力加以解决。目前首先要做的是完善 Unicode字符集中的汉字,找到一个最合适的汉字收录集合。这需要对古汉语用字作统计分析。其次,完善Unicode码位空间的划分,使之对汉字字集的支持更加合理。这些是从学术层面上采取的解决措施。然后还要从技术上入手,解决相关的字符集转换技术,提高字符集的灵活性。另外,寻找技术手段,减弱字符集同操作系统间的偶合程度,增大操作系统在字符集方面的灵活性。最后是寻找一个比Unicode更好而且能兼容以前所有字符集的编码方案。总之就是要尽快的彻底解决字符集问题。因为,古籍数字化的一切问题的都与它有关[4]。 2.2.2 古代文献的大规模录入问题 我国的古代文献种类繁多,数量庞大。除纸质的古代文献外,还有甲骨文、金文、陶文、竹简、帛书、石刻、砖文、印章、题记等。据不完全统计,仅公共图书馆系统收藏的纸质古籍善本即有两百二十万册左右,普通的纸质古籍约两千

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档