- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第35卷第1期 河南图书馆学刊 2015年1月
大数据对图书馆的影响研究∗
范春玲
(黑龙江省图书馆,黑龙江 哈尔滨 150090)
关键词:大数据;数据服务;图书馆
摘 要:文章在简述大数据特点及与云计算关系的基础上,分析了大数据带给图书馆的机遇和挑战,同时提出
了图书馆的应对策略。
中图分类号:G250.76 文献标识码:A 文章编号:1003-1588(2015)01-0124 -03
三分技术、七分数据,得数据者得天下的说法。
1 引言
2.1 大数据特点
随着信息技术的飞速发展和各类网络终端的涌 大数据的概念自提出以来,仁者见仁,智者见智,目
现,全球数据量呈现爆炸式的增长。 据国际数据公司 前尚未有让大家认可的标准表述。 但业界对大数据的
(IDC)的报告结果:2010 年为1.4ZB,2011年增长为 4V特性保持了一致意见,即:Volume(大量)、Variety(多
[1] 样)、Velocity(高速)、Value(价值)。 大数据的4个“V”
1.8ZB ,到2020 年,全世界所产生的数据规模将达
[2] 也就是4个方面的特点:①Volume 指数据体量巨大。
到今天的44倍 ,大数据时代已悄然来到。 最早提
出“大数据”时代到来的是全球知名咨询公司麦肯锡, 从TB跃升到PB级别,也就是只有PB级别的数据才可
之后《纽约时报》和《华尔街日报》都在专栏封面上推 称为大数据。 ②Variety指数据类型繁多。 如目前流行
出了该概念。 自此,国际上尤其是美国等发达国家掀 的网络日志、视频、图片、地理位置信息等众多类型的数
起了探究大数据的热潮。 2012 年奥巴马政府投资2 据。 ③Velocity指数据处理速度快,即可从各种类型的
亿多美元推出“大数据的研究和发展计划”,拉开了大 数据中快速获得高价值的信息,这和传统的数据挖掘技
数据作为全球性发展战略计划的大幕。 术有着本质的不同。 ④Value指只要合理充分利用数
目前,大数据技术还处于探索发展阶段,尚未 据并对其进行准确、正确的分析,将会带来非常高的价
[3]
得到广泛应用。 但笔者认为,作为以信息保存、开 值回报 。
发和利用为首要任务的公共图书馆来说,应明确认 2.2 大数据与云计算的关系
知,在大数据时代对纷繁复杂数据的保存和分析是 大数据的数量级通常达到PB级别,必然无法用
必须面对的挑战。 同时,图书馆人还应以特有的信 单台的计算机进行处理,而必须采用分布式架构。
息敏锐性和职业前瞻性来思考大数据对未来图书 分布式架构的特点是对海量数据进行分布式数据挖
馆发展的影响。 掘,但它必须依托云计算的虚拟化技术、分布式数据
库、分布式处理和云存储。 因此从技术上看,大数据
2 大数据概述
与云计算的关系就像一枚硬币的正反面一样密不可
大数据是互联网发展到现今阶段的必然产物, 分,但二者也存在一定的区别:云计算强调的是计算
是由人们日益普及的网络行为所伴生的,受到相关 能力,数据是操作对象,而大数据使
文档评论(0)