档案大数据定义与内涵解析.docVIP

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
档案大数据定义与内涵解析

档案大数据定义与内涵解析   摘 要:结合大数据和档案工作实际,定义档案大数据是与档案活动密切相关的各种有价值的、难以在可接受时间内分析处理的数据集。档案大数据来源于三个方面,具有4V+1C及时滞性、获取困难等特征,其实质代表了档案领域一种新的数据生成、存在和处理样态 关键词:档案大数据;定义;内涵 随着大数据的影响日益广泛,近几年档案界掀起了研究大数据的热潮。“档案大数据”一词频频出现在人们的视野,但迄今为止却很少有人对其定义和含意展开深入探讨,以至于在对档案大数据的理解中“存在着不同程度的概念泛化、夸大与误读。”[1]当前,大数据在档案领域正由概念论说向尝试应用阶段演进,迫切需要对档案大数据给出一个较为明确、科学的定义。鉴于此,本文在梳理已有论点的基础上,结合大数据的涵义,对档案大数据的定义和内涵进行阐释,希望有助于业界更科学地认识该问题 1 档案大数据定义的界定 受大数据浪潮的冲击,自2012年起,国内就有档案学者开始了对档案大数据的研究。但他们大多是从大数据的角度出发,探讨大数据对档案和档案工作的外围影响及其对策等。对于什么是档案大数据,很多人采取了模糊化处理的做法,只有高茂科和鲁德武两位学者专门厘析了其定义。高茂科采取直接套用大数据定义的做法,着重强调数据的规模。他指出,档案大数据就是档案方面涉及的资料量规模巨大到无法通过目前主流软件工具在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的信息。[2]鲁德武则以档案大数据所属范畴为基点,将档案大数据定义为档案中的大数据,即一定空间与时间范围内所有档案数据的集合。[3] 以上两位学者采用“属+种差”的方法,分别从不同的侧面揭示了档案大数据的特征,但这两个定义都存在一定的问题。高茂科的定义把信息作为档案大数据的属概念,将档案大数据的外延等同于信息的外延,并且将档案大数据的应用范畴局限于企业经营决策方面,不仅违背了普通逻辑学中“定义项和被定义项的外延必须相同”的规则,而且窄化了档案大数据的内涵。鲁德武的定义以数据在时间和空间上的全面性来界定档案大数据,突出了档案大数据的整体性特征,但他将档案数据的集合等同于档案大数据,显然没有准确地把握档案大数据的本质属性。同时,“全面性”固然是档案大数据的一个重要特征,但其也不能完整地反映档案大数据的全部意涵。因此,还需要对档案大数据进行更周密的分析 从词源上来看,档案大数据是由档案和大数据交叉而来的一个概念,它由档案和大数据两方面构成,所以要正确定义档案大数据,关键是要厘清“档案”和“大数据”这两个词在其中的涵义。而从字面上理解,此处的“档案”显然是一个限定词,其基本作用是将后面的“大数据”限定在“与档案直接有关的”这个范畴 至于何谓大数据,由于其目前尚处于被认识和应用的初级阶段,人们对大数据的理解还存在较大分歧,并没有就其定义达成一致意见,但通过文献梳理发现,大多数研究者倾向于从数据属性和技术层面来界定大数据。麦肯锡公司认为,数据规模超出传统数据库管理软件的获取、存储、管理以及分析能力的数据集就是大数据。维基百科指出,大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间限制的数据集。研究机构 Gartner 对大数据的定义是:需要新处理模式才能增强决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。徐宗本院士则将大数据定义为不能够集中存储、并且难以在可接受时间内分析处理,其中个体或部分数据呈现低价值性而数据整体呈现高价值的海量复杂数据集。[4]纵观这些定义,虽然各自对大数据的认知角度和侧重点不大相同,但它们却蕴含着一个共同点,即都认为大数据的核心是一种数据集,与传统的数据及处理技术相比,其具有数据体量大(Volume)、数据类型多(Variety)、价值密度低(Value)、处理速度快(Velocity)和复杂性(Complexity)特征 作为数据管理理论和实践的新发展,大数据开启了一次重大的时代转型,对包括政府、教育、经济、科技、医疗等在内的各个领域产生了深远影响。随着大数据技术与档案工作的交汇融合不断加深,来自档案层面及其业务活动的数据在数量、速率与种类上急剧且持续扩大,远远超出了传统数据处理软件和技术的能力范畴,由此导致档案大数据迅速兴起。因此可以认为,档案大数据指的就是将大数据技术和理念应用于档案业务领域产生的大数据。综合前文有关大数据的定义,我们对档案大数据作如下界定:档案大数据乃是在档案业务活动(包括档案产生、管理及利用活动)中形成,跟档案及档案业务活动密切相关的各种有价值的、难以在可接受时间内分析处理的数据集 2 档案大数据内涵的阐释 基于上述定义,可以从以下几方面来认识档案大数据 2.1 档案大数据的来源。由于档案大

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档