大数据时代档案数字资源整合难点及对策.docVIP

大数据时代档案数字资源整合难点及对策.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据时代档案数字资源整合难点及对策

大数据时代档案数字资源整合难点及对策   摘 要:随着信息技术及互联网技术的快速发展,社会迎来了大数据时代,冲击着人们的生活、工作及思维方式,并对数字档案资源的安全造成了极大的影响。在大数据时代,复杂的网络环境、各种攻击源及威胁的存在、数字档案资源安全保障体系不完善等问题严重威胁到了数字档案资源的安全。本文就大数据时代档案数字资源整合的难点及对策进行简要分析,仅供学习和参考。   关键词:大数据;档案数字资源整合;难点;对策   大数据是指无法在一定时间内用传统数据库软件工具对其内容进行采集、存储、管理和分析的数据集合。数字化、网络化、信息化已深刻地影响了人们的工作、学习、生活和娱乐,数字不再只和计算有关,更使人的生存方式发生了巨大改变,我们已不可逆转地进入了大数据时代。   一、大数据时代档案数字资源整合的难点   1.各种数字资源分散、独立、关联性不强。我们知道档案馆数字资源来源于许多下属档案部门,不同的档案部门提供不同格式的数据资源、 不同的数据库以及不同信息检索工具,这就使得不同部门的档案数据库存储不同类型的档案信息,各个数据库之间没有联系起来,不同的检索工具也只是适合于相应的数据信息。 这就使得档案管理人员很难有效地将这些数字档案信息资源进行统一管理,也使得利用者在查询相关档案信息时需要不断切换检索工具,使用不同的检索方法,为档案信息资源共享和用户利用带来不便。   2.数字档案信息质量参差不齐 ,内容有交叉重复甚至杂乱无序。在档案馆收集上来的大量数字档案信息中,存在着各种质量不一的数字信息,有许多数字档案信息在一些档案部门提交的数据库中存在交叉和重复,也有一些数字档案信息对档案馆只具有数字性而没有价值性。   3.数字档案信息存储格式和检索标准的不统一。无论是数字形式移交上来的数字档案信息,还是将传统载体档案信息转化来的数字档案信息,都存在着不同的数字格式和不同的检索工具。 比如:文本格式就有 TXT、DOC、PDF 等,检索工具也有全文检索、目录检索、主题检索等。 这也使得数字档案信息无法统一到一个信息平台上,无法使用简便统一的管理系统进行管理和利用。   4.目前数字档案信息资源系统大多为目录型数据库,二次数字资源和一次数字资源之间缺少链接关系,用户难以获取全文。   二、大数据时代数字档案信息资源整合的对策   1.明确数字资源整合目标   (1)整合档案馆尽可能多的资源包括:档案馆接收上来的各种电子文件,音频、视频等多媒体文件,由传统档案转化而来的数字化档案,全文数据库,目录或主体数据库,相关的数字资料、文献等。   (2)提供统一的界面并发检过异构资源,即通常所说的集成检索 、联邦检索、跨库检索、平行检索等能提供统一的检索界面,将读者输入的检索工具转换成符合不同资源要求的检索命令进行并发检索, 同时支持检索结果的去重与合并、统一格式显示、多种格式保存等。   (3)提供个性化服务。在档案信息资源共建与共享整合基础上,实现面向不同用户的资源组合和动态性重构,使之与用户需求相适应;在信息资源服务功能上,进行服务功能的整合,使用户能够充分而有效地利用整合资源系统;在用户界面上,进行交互性融合,使整合平台有交往地与用户界面接口;利用信息集成技术,过滤技术、知识挖掘技术,实现基于资源整合的定向服务;在系统个性功能中,能够为利用者提供个性化的学术信息环境和服务,利用者可以创建自己的资源列表和利用某一专题档案列表,建立个人的电子信息架、保存检索历史、设置定题资源提醒等。   2.确定整合资源范围   数字档案信息资源整合对象的种类和数量直接影响到资源整合的策略,因此对整合对象的全面调研和剖析是整合工作开展的必要前提。   各个档案馆应该根据各自数字档案信息资源整合目标和各馆数字档案信息资源特点,确定整合范围。   应包括各档案馆接收上来的各种类型数字档案信息以及自身馆藏数字化的档案信息,通过鉴定它们的内在价值和外在价值,从而通过建立网络数据库,光盘数据库,多媒体光盘等形式来明确数字档案信息资源整合的对象。   3.选择数字资源整合系统   要对多种不同类型的数字档案信息进行整合,并为利用者统一检索平台,就必须自主开发或是引进一种数字资源整合系统。随着数字资源整合的深入研究,国内外的信息学者以及软件商相继开发出了大量的数字资源整合系统。 国外比较典型的数字资源整合系统有以色列Exlib公司的MetalibSFX, 美国 Endeavor 公司的 ENCompassLinkFinderplus,美国 Innovation 公司的MAP 等 ;国内的主要有清华同方的TPI 跨库检索系统 、北京拓尔思的 TRS 资源整合门户、江苏汇文公司的一站式文献检索系统以及上海金鑫公司的跨数据库检索

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档