- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据视阈下档案学研究困境和启示
大数据视阈下档案学研究困境和启示
摘要:基于对CNKI档案类期刊的统计分析,本文探讨了大数据在我国档案领域内的研究现状,分析当前档案管理技术同非结构化的数据管理、资源转化效率同发挥档案的潜在价值、数据挖掘深度同个性化的用户利用需求之间的困境,并结合大数据理论指出其带给档案学研究的相关启示。
关键词:大数据档案学研究统计分析档案管理
Abstract:Based on the statistical analysis of ar? chive journals from CNKI, the paper discusses the research status of big data in the field of archives and points out the dilemma between archives man? agement technologies and unstructured data man? agement, resources conversion rate and exertion of potential value of archives, depth of data mining and personalized user needs. The paper also bring out some relevant enlightenment combined with big data theory.
Keywords:Big data;Archives science study; Statistical analysis; Archives management
所谓“大数据”,是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。它不单单指字面意义上规模庞大的数据量和数据集合,在认知和应用过程中更应将其理解为一种思维和管理方式,一种新的技术和数据管理视角。其实,无论将大数据看作复杂的数据集合,还是数据管理的思维方式,它的出现都是由数据的量变积累到一定程度引发的“质变”。近年来,各行业研究的重点都集中在“大数据”上,档案学的相关研究也开始聚焦大数据。我国档案学领域明确提出有关大数据的研究是在2012年,目前相关研究仍然集中在档案领域对大数据本身的认知上。鉴于此,本文从大数据在我国档案领域内的发展入手,并结合CNKI档案类期刊的共词聚类分析,探讨大数据对档案学研究带来的机遇和困境以及对我国档案事业发展的思考。
一、基于档案大数据研究的统计分析
(一)数据获取及处理
以CNKI中国学术期刊全文数据库为来源,以“大数据”和“档案”为主题进行检索。截至2016年5月,检索到2011~2016年的相关文献共计501篇。笔者从中选取研究的核心样本,并以此为依据分析档案学领域大数据研究的总体现状与核心热点。首先从501篇文献中剔除重复条目以及与档案大数据研究明显无关的学术论文和新闻报道后,得到文献456篇。然后,再按照来源刊物对456篇文献进行筛选,勾选出文献来源为档案类期刊、大学学报以及档案学相关会议和学位论文的,共得到281篇文献。最终以281篇文献样本作为档案学研究的核心样本,统计高频关键词。剔除“大数据”(99次)与“档案”(21次)后,得到排名前十位的高频关键词,其分别为档案信息(39)、档案管理(39)、档案数字化(32)、档案工作(26)、数字档案馆(22)、档案利用(19)、物联网(17)、档案事业(15)、信息技术(14)、档案管理模式(13)。
(二)关键词分析
共词聚类分析法,是通过对文献集合中“词汇对”共同出现的情况来构建共词矩阵,然后对矩阵进行聚类分析,从而确定该文献集合与所代表主题之间的关系,进而描述该学科的研究热点和发展趋势。为了较好地归纳出研究重点,在进行共词聚类分析时,先要找出关键词,进而构建共词矩阵。
1.构建矩阵。对核心样本所统计出的高频关键词两两配对,统计其在样本文献中出现的频率,建立共词矩阵,如表1所示。
利用Ochiia系数,将共词矩阵转换为相关矩阵,以减少统计频次的悬殊对分析结果所造成的影响。矩阵中的数字表示两个词之间的相关度,数值越大,表示二者之间的相关程度越高。其中,相关度较高的有档案信息与档案数字化(0.3963)、档案信息与物联网(0.3107)等。如表2所示。
2.聚类分析。在以高频关键词为基础建立的共词和相关矩阵上,利用SPSS软件对其进行聚类分析,可以得出在大数据背景下我国档案学研究的聚焦点和关联点。将表2的相关矩阵导入SPSS进行层次聚类分析,选择“组间平均链锁距离”,生成平均联接树状图。该方法能够将关系密切的对象聚合到一个小分类,稍远的
您可能关注的文档
最近下载
- 人教版七年级数学上册第五章一元一次方程.pptx VIP
- 超星学习通网课《从爱因斯坦到霍金的宇宙》尔雅答案2025题目及答案.docx
- 证监会行业分类指引 2012版 (2).xls VIP
- 通信中级整理-终端与业务.pdf VIP
- 【初中数学】第五章一元一次方程单元测试+2024-2025学年人教版数学七年级上册.docx VIP
- 快乐日记(三上日记范文).docx VIP
- 4.1 《喜看稻菽千重浪》课件(共46张PPT)统编版高中语文必修上册.pptx VIP
- 群众安全满意度培训课件.pptx VIP
- 石材厂15万吨年砂石料加工项目突发环境事件应急预案2024年第一版.docx VIP
- 道德与法治人教版二年级上册教案.doc VIP
原创力文档


文档评论(0)