当前档案大数据研究误区与重点研究领域思考.docVIP

当前档案大数据研究误区与重点研究领域思考.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
当前档案大数据研究误区与重点研究领域思考

当前档案大数据研究误区与重点研究领域思考   摘要:本文从大数据的概念和档案发展规律入手,认为当前档案大数据的发展方向是基于数据流的实时信息处理、分析与归档,指出当前档案大数据研究上存在的误区,并由此提出了档案大数据领域亟需研究的重点领域。   关键词:大数据档案数据流   Abstract:From the concept and development of the law of large data archives, and thinks that the cur? rent direction of big data file is based on real-time in? formation processing data flow analysis and ar? chiving, pointed out the existence of a large data ar? chive study on the current misunderstanding and thereby made archive large data fields need research focus areas and issues.   Keywords:Big data; Files; Data stream   进入21世纪,大数据时代的到来已经成为信息化发展的基本趋势之一,在社会各个领域不断融入大数据思维和引入大数据技术,掀起了新变革的浪潮。同样,“大数据”为档案管理领域带来了新技术、新理念,以及新的机遇与挑战,档案大数据研究也成为近年来档案管理领域的热点。但也有专家认为当前档案大数据研究存在一些过度炒作与概念“透支”现象,认为大数据的实时动态性、决策预测性特征与档案信息的滞后静态性、证据解惑性特征相偏离,提出要让档案大数据概念理性回归。[1]   笔者认为,当前档案学领域确实存在对大数据概念过度解读的现象,进而形成了研究热潮,但在研究的理念、方式、方法上与大数据时代的要求相去甚远,缺乏深度、广度与前瞻性。本文对档案大数据研究中存在的误区进行分析,澄清某些认识的同时,提出档案大数据研究的重点领域,以期起到抛砖引玉的作用,为档案界大数据深入研究提供参考。   一、对档案大数据概念的理解   什么是“档案大数据”?要正确理解档案大数据,有必要对“大数据”与“档案”这两个概念进行深入剖析。   (一)对大数据概念的认识   “大数据”描述的是随着数据量和数据类型激增而逐渐衍生出来的一种现象,包括大规模的、多样化种类的数据集,以及对数据集进行采集、处理、提取价值的技术架构与技术过程。[2]普遍认为“大数据”具有“4V”特征,即“数据量大”、“速度快”、“类型多”以及“价值密度低”。抛开数据的海量化生产和存储这种表面现象,由数据量变带来的质变之一便体现在思维方式的转变上。大数据时代带给我们的是一种全新的、颠覆性的思维方式,这种思维方式体现在:(1)分析全面的数据;(2)重视数据的复杂性,弱化精确性;(3)关注数据的相关性。因此,档案领域大数据研究的重点应该放在如何分析和应用档案数据的全面性、复杂性、相关性等特点上。   (二)对档案概念的认识   目前国内外对档案的定义有数百种之多,其定义角度和具体表达各不相同。《中华人民共和国档案法》将档案定义为“过去和现在的国家机构、社会组织以及个人从事政治、经济、科学、技术、文化、宗教等活动直接形成的对国家和社会有保存价值的各种文字、图表、声像等不同形式的历史记录”。通过该定义可以看出,档案可简化为“以各种形式承载的有价值的历史活动”。其构成要素有三个,即“载体”、“价值”和“活动”。随着社会生产力及科技文化的发展,档案载体实现了从甲骨、金石、简牍缣帛、纸墨文书、磁带、光盘、硬盘、缩微胶片不断变化。所谓档案的“价值”则取决于利用者的目的、方式和方法,是一种受主客观因素影响的判断。“活动”的释义则是“为达到某种目的而采取的行动”,涉及时间、地点、事件等诸多因素,其表达方式也是不断变化发展的。由此可见,“档案”这个概念是一个不断发展变化的过程,我们研究档案不能局限于纸质载体或单个的电子文件,或文本、照片、录像、录音等呈现方式。   (三)对档案大数据概念的认识   大数据概念与档案概念相结合得到的档案大数据,是大数据的概念、理论、技术与方法在档案领域的应用与实践。参考其他领域针对大数据研究的成果,我们可以得出档案大数据在实质上是一种基于发展的、动态的、数据流的档案观;基于海量数据的实时技术处理和知识挖掘过程;是一种基于数据全面性、复杂性、相关性的思维分析方法;是一种颠覆传统的、全新的档案管理模式。   二、当前档案大数据研究的三个误区   有人认为,大数据时代

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档