- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据时代背景下基于云计算未来图书馆数字信息资源建设
大数据时代背景下基于云计算未来图书馆数字信息资源建设
摘要:大数据时代的到来为图书馆服务提出了挑战,图书馆的传统业务受到冲击和压力,在大数据环境下使用云计算技术发展业务将成为图书馆未来的发展趋势。本文介绍了大数据和云计算的概念和特性,阐述了现阶段图书馆信息资源建设所面临的问题,分析了云计算在未来图书馆信息资源建设中的应用,最后探讨了云计算在数字图书馆中应用需注意的问题。
关键词:大数据;云计算;图书馆;信息资源建设
1 大数据
1.1 大数据的含义和分类 大数据之所以被称为大数据首先因为它的数据是海量的,而且目前随着科技发展,随着人们对互联网的依赖程度不断提高,这个海量的数据正在超速增长。其次,大数据是海量的数据被整理纳入大数据仓库里,然后对其进行分析挖掘,再利用有价值的结论进行下一步行动的决策[1]。
大数据从数据内容结构上可分为结构化数据、半结构化数据和非结构化数据。结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据,在形式上有诸如文字、数字、符号,能够用统一的形式加以标识。非结构化数据包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像、音频和视频信息等等,这些内容无法用简单的逻辑表达实现,分析起来也需要特别的硬软件。半结构化数据,就是介于结构化数据和非结构化数据之间的数据,它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。
1.2 图书馆的大数据 图书馆的大数据首先包括书目数据。这些数据一般属于图书馆稳定的结构化数据,目前这些数据的使用多用SQL工具分析。对于结构化的数据,小规模的数据,目前的分析工具足可以用了。对这些数字化书目数据做分析可以反映出一个图书馆馆藏的级别、服务的对象、服务的倾向和服务的质量。
图书馆的大数据虽然以结构化数据为主,但随着图书馆新服务的开展,图书馆与读者的互动信息,以及读者面对图书馆的各种信息行为都会被记录,这些信息将成为图书馆大数据中的非结构化数据。这些动态的非结构化数据可以来自图书馆业务内容,也可以来自读者服务体验。
2 云计算
2.1 云计算的概念 云计算是并行计算(Parallel Computing)、分布式计算(Distributed Computing)和网格计算(Grid Computing)以及Internet 结合起来的新的网络资源提供模式。云计算是以虚拟化技术为基础,以网络为载体,以提供基础架构、软件、平台等服务为形式,整合大规模可扩展的计算、数据、存储、应用等分布式计算资源,进行协同工作的超级计算模式[2]。它不仅是资源的简单汇集,而且为我们提供了一种管理机制,让整个体系作为一个虚拟的资源池对外提供服务,并赋予开发者透明获取资源、使用资源的自由。
2.2 云计算的特点
2.2.1超强的计算能力 云计算由成千上万台服务器组成的集群能赋予用户前所未有的能力。用户可以拥有超大的存储和管理空间,以及超强的计算能力。
2.2.2海量的存储空间 云计算为数据的存储提供了广阔的空间,它是将大量的服务器集群共同组合在一起,形成巨大的空间,所有的数据通过云计算中心运算处理后返回给用户。
2.2.3可靠的安全保障 云计算使用了数据多副本容错、计算节点同构可互换等措施来保障服务,存储在云里的数据资源丢失或硬件崩溃都不会受到影响,云计算技术存储数据安全可靠。
2.2.4便利的资源共享 由于是将大量的信息汇聚成一个整体,对于同一资源可以供多方共同使用,从而避免了资源不必要的重复,进而提高了信息资源的共享程度。同时,云计算可以针对不同应用即时应对,规模可以动态伸缩,云计算下的资源可以根据应用和用户规模增长的需要随时进行动态扩展和配置。
2.2.5良好的系统兼容 对于不同的操作系统,不同的数据格式,不同的数据库之间的数据,云计算可以通过一站式检索不同系统中的相同信息,系统之间可以无缝连接和访问。
3现阶段图书馆信息资源建设面临的问题
图书馆的数字资源包括图书馆引进或自建的,拥有磁、光介质或网络使用权的数字形态的文献资源。根据数字资源的种类可分为:电子书、电子刊、二次文献数据库和其他数据库。根据数字资源的存在形式可分为:在线资源和本地镜像资源。根据数字资源的来源可分为:购买的数据库、自建数据库、试用数据库和免费数据库[3]。现阶段图书馆都是各自为政,在建设的过程中存在着很多问题。
3.1 数字资源重复建设问题 目前,馆与馆之间数字资源的建设都是相互独立的,在建设过程中都是按照学校经费多少和专业的需求进行资源建设,一般都不会考虑其他馆的建设情况,只埋头建设自己的数字资源。这样势必造成了大量的人力、财力的浪费,从宏观的角度看不利于高校图书馆的发展。
原创力文档


文档评论(0)