《古籍数字化工作规范》.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

一、古籍数字化基本原则

原则

核心要求

技术指标示例

保真性

原貌无损呈现,禁止修饰篡改

色差值ΔE≤3.0(ISO12646)

可逆性

原始图像与处理文件分离存储

RAW格式永久保存

可持续性

采用非私有格式,兼容未来技术

图像:TIFF;文本:XML/TEI

安全性

原件零接触扫描,库房温湿度联动监控

温度16-20℃;湿度45-55%RH

二、数字化全流程规范

1.前期准备

选本标准:

优先数字化一、二级破损古籍(《古籍定级标准》GB/T30227)

同版本多复本时,选品相最佳者

拆解规范:

蝴蝶装:允许拆线扫描(需备案)

卷轴装:禁用压平,采用曲面扫描

2.图像采集

参数

普通古籍

善本/彩绘

分辨率

400dpi

600dpi

位深

24bitRGB

48bitRGB(高动态范围)

光源

LED冷光源(色温5500K)

多光谱成像(紫外/红外)

设备

非接触式扫描仪

轨道式数码后背

操作禁忌:

禁止使用玻璃压板(防绢本文物断裂)

扫描仪表面照度≤50lux(ISO3664:2009)

3.图像处理

校色标准:

使用24色标准色卡(如ColorChecker),在AdobeRGB色域内校正

去污要求:

允许去除非信息污渍(霉斑/水渍)

禁止修改文字笔画(如描补缺笔)

存储格式:

4.文本化处理

方式

适用场景

准确率要求

人工录入

珍本/异体字多的古籍

≥99.99%

AI识别

规范楷体/宋体刻本

初校≥98%;终校≥99.9%

混合模式

行书手抄本

AI初识+三审三校

校对标准:采用《古籍校勘记著录规则》(GB/T39342-2024)

三、元数据著录规范

1.核心元数据(MARC21扩展)

字段

必填项示例

题名

原题名+规范简名(《四庫全書總目》著录)

责任者

著者+刻书者+批校者(多级著录)

版本

刻本类型+年代+藏版地(如“清乾隆53年武英殿刻本”)

物理特征

尺寸(cm)+装帧+破损描述(按ISO11799)

收藏信息

藏书印+题跋+流传经过

2.关联规范

时空关联:关联历史地图API(如“刻书地:南京→明代应天府坐标”)

人物关联:对接CBDB(中国历代人物传记数据库)

四、存储与发布标准

1.存储架构(三级备份)

保存周期:

在线:10年

近线:30年

离线:永久

2.发布平台要求

功能

技术实现

用户权限

全文检索

支持繁简/异体字转换(如“爲→为”)

公众开放

图像比对

多版本同屏对照(如宋本vs明本)

研究机构授权

知识图谱

实体识别+关系挖掘(人物/地点)

分级开放(涉密过滤)

五、质量验收(关键指标)

检测项

合格标准

测试工具

图像几何失真

边缘畸变≤0.3%

Imatest分析模块

OCR准确率

正文≥99.9%;小注≥99.5%

古籍OCR评测集

色彩还原

色差ΔE≤3.0

X-Ritei1Pro3

文件完整性

SHA-256校验100%匹配

HashCalc

六、版权与知识产权

1.版权标识

著录规则:

[作品类型]:影印本/点校本

[版权状态]:

●1644年前古籍:公有领域(PD)

●1644-1912年:受限PD(需标注来源馆)

●1912年后:依《著作权法》第21条认定

2.使用控制

水印嵌入:不可见数字水印(符合ISO/IEC23001-7)

敏感内容:涉民族/宗教古籍需专家审核后发布

七、地方特色古籍处理规范

古籍类型

特殊要求

案例

敦煌遗书

多光谱成像+卷轴三维建模

法国国家图书馆BD合作项目

少数民族古籍

双语文著录(原文+汉译)

《西南彝志》数字化

中医古籍

药物图谱关联《中华本草》数据库

《本草纲目》知识图谱

规范依据:

《图书馆古籍书库基本要求》(GB/T30236-2024)

《古籍特藏破损定级标准》(GB/T24428-2024)

《国家古籍数字化工程白皮书》(2025)

创新方向:2025年试点区块链存证(如“古籍数字指纹”),构建不可篡改的数字化谱系。

文档评论(0)

19980417a + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档