浅谈科研机构对文献资源的数字化管理.pdfVIP

  • 5
  • 0
  • 约6.6千字
  • 约 2页
  • 2017-04-24 发布于北京
  • 举报

浅谈科研机构对文献资源的数字化管理.pdf

浅谈科研机构对文献资源的数字化管理.pdf

新一代信息技术 China Science Technology Overview 浅谈科研机构对文献资源的数字化管理 任丽平 (同方知网(北京)技术有限公司,北京 100192) 【摘 要】对于科研机构而言,能够将其存储和积累的文献信息资源进行数字化组织管理;因此本文简要概述资源在数字化的组织管理中的五个 方面, 资源的采集、资源的数字化加工、资源的管理、资源发布检索、资源组织管理的质量控制; 【关键词】资源采集 资源加工 数字信息资源 数字资源组织 数字资源管理 随着数字技术的飞速发展,越来越多的信息资源成为网络上可 设依赖于机构的宏观信息环境,如文献信息部门、新闻媒体、信息网 以被访问的资源,从简单的文本到声音、图片、视频等都加入这一行 络等社会组织或媒体,它们是组织获取信息的主要来源,因此这些 业。环境的变化带动了机构对自身资源的数字化组织管理,尤其是 资源对机构的信息资源组织建设也有大的影响。 对科研学术机构而言,能够将其存储和积累的文献信息资源进行数 2 资源数字化加工 字化的组织管理更是具有十分重要的战略意义。在组织管理中深入 开发和广泛利用信息资源,包括资源的采集,存储,处理等,包括采 零散的资料,如,杂志,图书,古籍等,在数字化的加工环节,首 纳先进的技术和思路,达到资源的数字化建设管理能为机构的科研 先要结合各类资源进行纸质文档数字化,如借用扫描仪、数码相机 创新提供有力保障。 等设备对纸质档案进行数字化。在数字化过程中,并非简单的扫描 或照相,而是有一个尽量详细的过程。 1 资源采集 2.1 数字化加工过程 本处所说资源主要是文字、图片、音频、视频等,因此资源采集 (1)扫描:通过扫描仪和专用扫描软件,转换为电子的图像文件 整理中,首先对资源进行大的分类,如:图书、期刊、会议资料、报刊、 格式。对扫描后的文件要求使用软件进行校正、去噪、版心校正、剪 视频、音频、古籍等 ;对于古籍的采集要考虑其加工和保存的独特 裁、反转、灰度图像页亮度及对比度的调整、整书去除装订孔、整书 性。在进行大的分类后,对资源可按学科领域进行小的分类,当然也 裁边、增加图章、内容居中等功能。 扫描过程严格要求页号顺序,必 可以结合自身资源的特征进行新的分类定义,总之要求资料按要求 须保证图像质量与原件一样清晰。 进行分类、组卷、排列、修补、编写案卷号等。 (2)文字识别:本文以OCR为例,OCR软件将扫描生成的图像文 在采集当中,有些是机构自身现有的资源,而机构自身资源无 件自动辨识成文本字符。OCR的识别率不可能达到100%,因此经 法满足需求时需要借用各种渠道获取资源,如网络下载,购买其他 OCR处理之后,需要编辑进行校对或补充。尤其是档案类的,要求编 商家资源作为自身资源的互补,如买适合本机构的某一研究领域的 辑校勘后达到与原始信息100%的一致。对于目录页,可通过工具增 数字资源。当前在资源采集中,一般从事科研学术的机构对资源需 加目录项的连接,通过对目录项建立其对应的物理页码,建立目录 求量大。 导航浏览。 在资源的采集过程中,我们还应当认识到,机构的信息资源建 (3)规范记录:即编辑加工过程,编辑加工过程可参考《CALIS联 表 1 期刊元数据表 期刊标引项 描述 中文题名 文献的题名。包括正题名、副题名、并列题名

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档