- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
各工序制作规范
前期预备环节
1.图书编号
为了便于管理,项目中所有加工图书均采用统一编号。编号长度为8位,分为2段,格式为“AADDDDDD”。
其中,AA代表资源加工中心代号,本公司的加工代号是“06”;
DDDDDD为6位流水号,唯一标识对应一本图书。
每本图书与编号一一对应,不能出现一本书重复加工,使用两个编号的情况,或一个编号被两本书同时使用的情况。
2. 工作目录路径
在扫描图书之前,现场管理员在工作站上预先建立一些目录来存放图书扫描
和识别的结果以及相应的元数据。
在每个目录下,又细分为3 个子目录:OTIFF, PTIFF 和META。其中,OTIFF
最初存放扫描的TIFF 图片文件,最终存放去污后的TIFF 图片文件,PTIFF 存放
识别及转换产生的DJVU 文件,META 存放图书的目录文件catalog.xml、元数据dc.xml及a.opf文件。
元数据
参照《著录规则06417》。元数据内的标点符合均在全角状态下录入。
图像扫描
1.命名
扫描图像必须与原页面一一对应,不得出现颠倒、缺页、重页或错页情况。图像按流水顺序以tiff格式保存,文件名tif依次排布。即schema name为########。
注:页码不连续的以缺页代替。连续5页以上缺页,只要扫一个缺页,缺页的页面里标注“缺10-25”。
2.分辨率
扫描分辨率标准为600dpi二值,二值TIFF图像采用CCITT4压缩格式,图像格式为tif;
对于有灰度插图的页面,采用600dpi 256级灰度,256级灰度TIFF图像,采取LZW算法进行压缩,图像格式为jpg;
对于彩页,采用600dpi 32K色扫描,采取无算法进行压缩,图像格式为jpg;
颜色模式为为Binary,图像均保存原图于OTIFF目录下。
对于普通图书,彩色封面、封面折页、封底折页、不含照片的彩色插页和灰度插图的页面,均采用600dpi 256级灰度扫描;对于含有人头照片、风景照的彩色插页及对于图像有特殊要求的(如广告),采用600dpi 真彩色扫描。
注:1、三页以内(含三页)JPG页面扫描必须扫正
2、由于彩色JPG页面后道工序不作处理,所以要求扫描时每一页面尽量做到无白边、黑边,不倾斜。
3、所有页面遵循阅读方向(不论有没有页码)
4、扫描时如无封面,扫书脊
3.清晰度
扫描图像字迹清晰、颜色恰当,不宜过浅或过深,并且不得出现字迹笔画残缺或字迹笔画叠合而影响阅读的情况,即使原书本存在锈斑变质、颜色过浅或深浅不一致,也应保证扫描图像可读。
对于古籍,因书本颜色泛黄,纸张诱斑变质、颜色过浓或深浅不一致现象极严重,扫描员必须反复调试扫描参数,兼顾页面整体效果,尽量做到扫描图像基本可读。由于书本页太薄或颜色过浓,扫描时会倒映反面文字,其文字上的污点无法去污,但需保证正文文字能看清楚。
扫描留下的黑迹宽度不得超过0.5厘米,并且指印和黑线不能覆盖或影响书本正文内容。
4.图像内容
扫描的页面内容基本居中显示,不可出现明显偏左或偏右的现象。
页号、页眉、页脚信息完整
图像内容与书本页面完全对应,不得出现书页内容残缺或将旁边页面信息扫入本页的现象。
对于古籍,因书本普遍极为陈旧,页面纸张十分脆弱,很多书本页面破碎不全,扫描无法将内容扫全,但图像内容必须保证书本原貌,与书本页面完全对应,不得出现原书页内容残缺或将旁边页面信息扫入本页的现象;另外,古籍书本全部都是线装订形式,有些书本装订线覆盖了部分页面内容,如书不允许拆装的情况下,扫描应在尽可能不损坏书本的前提下,尽量将页面有用内容扫描下来。
普通图书的书脊页不予扫描,封面折页或封底折页如果为空白或颜色也不予扫描;否则封面、封二、折页、封底都必须按图书顺序依次扫描。
图像处理
对于彩色与灰度的扫描图像只要将页面旋转成正面即可,黑白的扫描图像,图像处理需要注意以下几点:
图象处理后必须保证图象信息与原书本内容完全一致,不得删除页面任何有用信息,包括正文内容、页眉、页脚、手写注释和印鉴等(图书馆藏书章除外)。
2.??? 所有扫描留下的黑线、指印或阴影都必须清除干净。
3.??? 扫描图像整体倾斜不得超过3度;不得出现图象的一部分倾斜或扭曲而影响阅读的现象。书本页面存在部分倾斜的,以页面中的文字纠正为准。
4.??? 对装订线较近的书本或较厚书本,边角的几个字会产生扭曲现象,但需保证正文文字能看清楚。
5.??? 由于书本印刷质量或纸张质量等造成的页面上有零星的污点,如果在页面视图下看不清楚,或该污点嵌在文本行中无法清除,可以不清除,但要保证图像可读。
6.???所有TIFF图像都必须采用识别及转换
您可能关注的文档
最近下载
- 吊篮日常检查记录.doc VIP
- 16S401 管道和设备保温、防结露及电伴热.docx VIP
- 2025年黑龙江、吉林、辽宁、内蒙古高考地理试题评价分析与教学反思理试题评价分析与教学反思.docx
- 2019人教版高中数学A版 必修第2册《第九章 统计》大单元整体教学设计[2020课标].pdf
- 人教版(2024)八年级上册英语Unit 1 Happy Holiday教案.docx
- 建筑装饰设计基础第1章电子课件 .pptx VIP
- 心理健康教学课件:七年级上第1课走进心理健康课.pptx
- 天然气调压器切断阀介绍.ppt VIP
- 对外汉语时间教学.ppt VIP
- 《人造板工艺学》课件 第十三单元 生产工艺设计.ppt VIP
文档评论(0)