- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据背景下数字图书馆面临机遇与挑战分析
大数据背景下数字图书馆面临机遇与挑战分析
摘 要:现下图书馆表现出大数据的特性。大数据于图书管相关服务方面发挥着协助功能,但同时也暴露出一定的不足。图书馆需要聚焦知识服务的发展形势,通过全新技术的应用完成大数据解读,避免以往知识服务的不足,相对可观地获得深层次的大数据内容,使得图书馆服务实现进一步开拓。
关键词:大数据;图书馆;知识服务
1 引言
最近几年由于互联网蓬勃成长而出现了各式的数据形态,既存在以往类型的结构化数据,还包括众多半结构化以及非结构化数据。种种迹象显示出了大数据的来临,其代表的是海量数据涌入人们的生活,而从内容方面来看更是异常丰富,属于海量数据的拓展。处于这一背景之下,图书馆资源表现出了大数据的特性,基于数据的相关知识服务既获得了机会,同时也迎来了挑战。图书馆需要尽可能明确大数据的长处以及特征,解读目前知识服务暴露出的问题,研究制定全新的服务措施,帮助读者获得更贴合需求的服务。
2 大数据为图书馆知识服务再拓展提供可能
知识服务的概念为:依照用户的要求,有目的的由多类或是显性或是隐含的资源内获取整合知识,同时基于此处理用户提出的深层次问题的整个环节。 [1] 根据统计学来看,追求精准的成果就要获取更多的数据,利用优化运算的方式可以探索到全新的内容。图书馆经过多年的沉积,现已展示出大数据特征。大数据让图书馆涉及内容更加多彩,同时在运算方面速度更快,而投入量相对降低,这些均导致数据量的大幅增加。
除此以外,大数据使得数据的处理相对合理精准。移动服务大面积推广使得图书馆数据丰富,特别是非结构化数据。尽管伴随数据呈现出愈加复杂的势头,但是涉及数据类别的丰富,数据处理成果的交叉验证随之提升,因此有助于数据处理合理程度以及精准水平的提升。[2]
3 大数据时代图书馆知识服务面临的挑战
3.1 数据平台与安全技术
图书馆大多涉及的是关系数据库平台,而在常用的RDBMS之中,由新技术拓展的非结构化数据处于弱势地位,倘若继续使用RDBMS的手法控制非结构化数据,将导致存储模块的流失,过量的数据内容汇聚于同一数据库同样使得数据库读写不顺畅。现下大部分图书馆为追求便利的数据储存,因而使用了集中存储的手段,这将便于图书馆方面明确每一块工作的落实状况,还有读者使用服务项目的效果。然而由安全方面入手,此类手法暴露出不足之?。目前图书馆数据与个体的隐私以及知识产权息息相关,同时集中存储时常发生系统漏洞或者不安全因素的产生。同时,大数据涉及到的非关系数据的提升表现出非线性特点,但是现下图书馆采取的措施大多面向的是线性扩增的数据。
3.2 分析引擎与知识发现
大数据分析对实时性提出了严苛的态度,读者使用的顺畅程度会作用于图书馆服务的水平,而图书馆以往数据分析水平不足。伴随图书馆网络系统的大规模推广以及和读者越来越多的互动,动态交互数据激增。由于同时登录的读者数目增加让数据仓库处理状况不良,改善服务器缓存效果同样无法有效地舒缓此方面压力。图书馆各代知识服务在更新换代之后均将造成知识库数据源涉及单位的扩增,使得其结构愈加复杂。所以以往的查询功能朝着多表查询以及数据处理结合的方面过渡,进而数据结构于横向伸缩特性方面达到需要。而现下的图书馆信息服务网络不具备这一效果。
4 大数据时代图书馆知识服务解决方案
4.1 大数据物理存储平台
它属于图书馆大数据知识服务构造的前提,依照不同的要求解读数据储存措施还有划分数据节点。由于图书馆涉及的数据量以及类别范围的广阔使得不能通过一致的标准来实现物理存储。除去增量方面投入非关系构造HDFS以外,其他部分继续保持以往关系型构造,这属于一类相对优越的手段。关系型架构通过以往的服务器还有磁盘阵列模式组建而成,再利用RAID加以数据重建,把数据各自存储于磁盘阵列内部,同时通过SAN协议实现计算机以及存储装备二者的信息交互。此类手法已经充当图书馆以往信息服务手法实施已久,表现出相对优秀的稳定程度自己安全水平。非关系型架构HDFS对照RAID表现出一些差距,其属于一类分布型文件系统,它的中心环节NaneNode 用于控制文件系统涉及的元数据,以及控制不同数据节点DataNode ,每一DataNode就属于一个 机架,不同的DataNode利用交换机加以连通,NameNode把数据文件划分放入许多不同的DataNode内, 同时于用户涉及此方面时把DataNode下的信息汇合在一起呈递于用户。HDFS通过TCP/IP协议实现具体的连通,此类构造手段能够可观地通过集群的效果实现便捷的存储以及迅速的计算,可以面向超大数据集加以科学、可行的分布型处理。
4.2 大数据采集平台
采集平台依照图书馆使用人员反馈的需要,明确涉及的
原创力文档


文档评论(0)