古籍数字化实践和探讨.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
古籍数字化实践和探讨

古籍数字化实践和探讨   〔摘 要〕古籍数字化的标准规范与质量控制问题是古籍数字化的关键问题。本文从图像资源和元数据方案两方面探讨了古籍数字化的标准规范,并通过古籍数字化实践,总结出质量控制的具体措施。   〔关键词〕古籍数字化;数字化标准;质量控制;数字化实践   DOI:10.3969/j.issn.1008-0821.20.01.013   〔中图分类号〕G250.74 〔文献标识码〕A 〔文章编号〕1008-0821(20)01-0052-04   Research on Digital Practice of Ancient BooksLiu Congming   (Library,Tsinghua University,Beijing 100084,China)   〔Abstract〕The digital standard and quality control are crucial factors in digitization of ancient books.This paper discussed the digital standard about image resources and metadata,and summed up the measures of quality control through the digital practice of ancient books.   〔Keywords〕digitization of ancient books;digital standard;quality control;digital practice      在古籍数字化过程中,一方面,需要认真履行标准化规范,只有建设标准规范的数字资源,才能真正实现古籍的共建共享。另一方面,还需要进行严格的质量控制与检查,只有这样才能提供高质量的数字化古籍,才能保证古籍的利用和研究,也才能真正实现古籍数字化的意义。   1 古籍数字化标准规范   古籍数字化实践时,只有按照标准规范进行古籍数字化工作,才能更有利于古籍数字资源的共享,才能更有利于对古籍进行深层次的研究[1]。2002年10月份,由中国科技信息研究所、中国科学院文献情报中心和中国国家图书馆联合将近20个单位组织规划我国数字图书馆标准规范建设,针对古籍制订了元数据应用规范和著录规则[2]。2007年1月,国务院办公厅颁发了《关于进一步加强古籍保护工作的意见》,明确指出:制定古籍数字化标准,规范古籍数字化工作[3]。   1.1 图像资源的标准参数   随着数字化技术的发展以及古籍大规模数字化的开展,扫描成为古籍数字化的必经之路。扫描得到的图像资源越来越被人们认可,并逐渐成为主要的数字资源格式,或者说是古籍进一步数字化开发的基础。图像资源相对于文字资源,有着更丰富的信息,对其进行数字化描述需要的参数很多[4],主要有图像格式、图像色彩、压缩方式以及分辨率等。   1.1.1 图像格式的选择   在图像格式的选取方面,各个数字化项目采用的标准都有所不同,比如美国国会图书馆在“美国记忆”(American Memory)[5]项目中,从多角度考虑选取图像格式,详见下表。表1 根据资源类型进行图像格式的选择   资源类型图像格式只包含文字TIFF包含插图PCX由多页组成PDF局部需要压缩MrSID地图类MrSID??(压缩比约22∶1)、JPEG2000??(压缩比约20∶1)印刷品和相片TIFF表2 根据资源用途进行图像格式的选择   资源用途图像格式浏览服务JEPG与GIF缩略图显示低像素GIF   由表1、表2可以看出,由于从资源类型、资源用途多方面考虑,制定了多个标准规范。那么,在数字化操作时容易造成混乱。   CADAL项目中,在古籍数字化时主要从保存与利用两个方面考虑:从保存的角度,由于TIFF格式具有开放的标准,其源代码可免费获得,几乎可以满足各类物理资源图像数字化的需求,而且TIFF还是被众多文化机构使用的国际标准[6],所以选择TIFF格式作为保存图像格式。从利用的角度,由于DjVu不仅具有开放的标准,其开放源代码也可从网络免费获取,采用DjVu图像格式有利于资源的利用。   1.1.2 图像色彩   在图像色彩的选择时,并非色彩位数越高越好,在古籍数字化实践中需要根据古籍资源特点选择适当的图像色彩,合理的色彩选择既可以节约存储空间,提高数字化的效率,还可以提供较好的图像品质。表3 TIFF格式彩色、灰度、黑白对比   位深色彩例 图文件大小24位彩色.3M8位灰度3.79M 续表3   位深色彩例 图文件大小1位黑白487K   20年1月第31卷第1期古籍数字化实践与探

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档