关于大数据时代图书馆现状一些讨论.docVIP

关于大数据时代图书馆现状一些讨论.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于大数据时代图书馆现状一些讨论

关于大数据时代图书馆现状一些讨论   【摘 要】大数据时代的到来,对我们的思维、工作方式都产生了重大的影响,图书馆学界也对大数据进行了广泛的研究和讨论,笔者先是概述了大数据的概念、理念、特征、应用,然后结合图书馆现状,指出图书馆在大数据时代面临的挑战,希望借此与同行进行进一步地探讨。   【关键词】大数据;图书馆;数据挖掘0 引言   从全球知名咨询公司――美国麦肯锡咨询公司最早提出“大数据”的概念后,美国政府又在2012年2月宣布推出“大数据的研究和发展计划”[1],“大数据”时代正式开启,大数据已经成为最近几年来各行业研究的热点,图书馆学界也加入了这股热潮。尽管对于大数据这个名词大家已经耳熟能详,但还是引起了很多的困惑。笔者就大数据的概念、应用进行了一些梳理,结合目前图书馆界关于大数据的相关研究文献,提出了自己关于大数据时代图书馆的一些观点。   1 大数据的概念   大数据并没有一个确切的、完整的定义,从提出这个概念以来,研究大数据的专家学者们就没有对这个概念达成过共识,基本上各人有各人的理解与定义。刚开始时,这个概念指的是需要处理的信息量太大了,已经超出了一般电脑能处理的数据量。大数据目前得到公认的是大数据的“4V”特性,Volume(大量)、Velocity(高速)、Variety(多样)、value(价值)[2]。其中Volume指收集和分析的数据量巨大,从TB级别上升到PB级别;velocity指数据处理速度要足够快,与传统的数据挖掘技术有着本质的区别;Value指数据中蕴含着潜在的价值转化,虽然大量的数据表现出价值密度低的特点,但只要有足够的技术储备,合理的利用数据,对数据进行准确的挖掘、分析,可以带来很高的价值回报;variety指数据类型多样复杂,这些数据不单包括传统数据库表格整齐排列的结构化数据,更多是视频、音频、图像、电子邮件、即时通信工具、微博、社交网络等以非结构化文本存储的数据。所以,有人总结大数据是“海量数据+复杂类型”的数据,包括分析、带宽、内容三个要素,其核心因素是蕴含价值[3]。   2 大数据的应用   维克托?迈尔?舍恩伯格在他的著作《大数据时代》中指出,大数据的核心是预测,它通常被认为是人工智能的一部分,但其实这是带有误导性的,相反,它是把数学算法运用到海量的数据上来预测事情发生的可能性。他在书中举例说明2009年甲型H1N1流感爆发的时候,谷歌公司通过人们在网络上的检索词用于一个特定的数学模型后,比疾控中心更有效、更及时的反应了流感爆发的情况。还有奥伦?埃齐奥尼(Oren Etzioni)建立的Farecast机票预测工具,到2012年为止,这个工具用了将近10万亿条价格记录,最终票价预测的准确度已经高达75%。还有Amazon如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐,以此有效提升销售量。他在书中的百般举例其实都是为了证明大数据的核心――预测。   3 大数据时代下的图书馆   图书馆历来作为储藏知识信息的场馆,随着近十几年来数字图书馆建设的步伐大大加快,图书馆所拥有的数据已经极其庞大并且数据类型也多种多样,特别是近年来,数据量增加的速度更是以前难以想象的,到今天图书馆已经基本上具备了大数据的特征。   3.1 图书馆学界目前对于大数据的研究现状   为了了解国内图书馆学界对于大数据的研究,笔者借助中国知网检索了图书馆学跟大数据相关的论文,在中国知网上按篇名,使用“大数据”、“图书馆”两个关键字(合并条件)进行检索,2011年是0条结果,2012年是4条结果,2013年度是58条结果,2014年迄今为止是173条结果。通过这些结果来看,大数据已经引起了我国图书馆界的专家学者们的重视,相关的研究正在飞速的发展。陆静在总结图书馆学界对于大数据研究的相关文章后总结出我国图书馆界大数据研究呈现的主要特点为:①论文数量呈逐年上升趋势。2011年以前主要研究的是计算机领域大数据量体系结构方面的内容,2012年专门研究大数据的文献开始出现,2013年激增;图书馆界发表文献也呈增长态势。②发表的论文主要集中在计算机类和管理类期刊。检索得知,刊载大数据研究论文的期刊大多集中在计算机类和管理类,近两年来图书情报学期刊也刊载有较多大数据的文章,反映出图书馆界借鉴大数据理论进行学科的交叉研究之趋势;其他刊物发文数量则较少。③研究视角多样化、研究的重点较突出。刊载在计算机类刊物上的论文主要侧重于大数据的技术架构和设计,而管理类刊物则侧重于大数据的理论探讨和现实借鉴等。④对大数据的应用实践研究不太重视。我国图书馆界重在对大数据的理论介绍,而忽视了大数据在图书馆的应用实践研究[4]。   3.2 大数据时代图书馆面临的挑战   在大数据时代,数据是基础,是大数据的矿产

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档