- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据驱动下的图书馆服务创新
〔摘要〕图书馆日益增长的数据体系已呈现大数据之势,其服务品质的颠覆与提升可依托大数据来实现。图书馆可通过对借阅数据、入馆数据、电子资源利用情况、学科馆员服务情况以及自助设备利用情况等大数据的采集、分析和挖掘来创建全方位的智能服务体系,从而提升图书馆的核心竞争力和影响力。
〔关键词〕大数据;创新服务;智能服务
1大数据概述
11大数据的定义
大数据通常用来形容一个公司创造的大量非结构化、半结构化和结构化数据,它超过了传统数据库系统的处理能力,其规模和传输速度要求很高,不适合通过原来的数据库系统进行采集、处理和分析,为了获取大数据中的价值,我们必须选择另一种方式来处理它[2]。
12大数据的特点
业界通常用4V(即Volume、Variety、Value、Velocity)来概括大数据的特点:(1)容量(Volume),即数据体量巨大。数据存储单位从TB级跃升至PB级(1PB=1024TB),甚至一些大企业的数据量直逼EB级(1EB=1024PB),传统的集中存储与计算分析已经无法应对呈指数增长的海量数据。(2)多样性(Variety),即数据种类繁多。相对于以往便于存储的以文本为主的结构化数据,以访问日志、检索历史、E-mail、社交媒体、微博微信等为表现形式的半结构化和非结构化数据呈上升趋势,因此对数据的处理能力也提出了更高要求。(3)价值(Value),价值密度的高低与数据总量的大小成反比,大数据普遍呈现价值密度低的共性。以检索历史为例,在成千上万条的记录中,最终分析出有价值的信息可能仅有一两条。(4)速度(Velocity),要求有较快的处理速度和响应速度,这是大数据区别于传统数据挖掘的最显著特征。在PB级的海量数据面前,处理数据的效率就是企业的生命,用户不仅需要通过数据了解正发生什么,更需要通过对数据的深度分析,预测将要发生什么[3]。
13大数据的意义
信息的移动化传播与大量智能终端的广泛应用使得数据的来源类型变得丰富、多样,越来越多的非结构化和半结构化数据呈爆发式增长,社会发展进入到了大数据时代,大数据将成为社会资源的一部分而备受重视,并将会带来三大根本性变革。一是大数据让人们脱离了对算法和模型的依赖,数据本身即可帮助人们贴近事情的真相;二是大数据弱化了因果关系,可以挖掘出不同要素之间的关联关系,人们不需要知道这些要素之间为什么相关就可以利用其结果,这样的应用将大大提高效率;三是与传统的数据库技术相比,大数据可以处理半结构化或非结构化的数据,这就使得计算机能够分析的数据范围迅速扩大[4],有利于推动创新发展。
2图书馆呈现大数据的特征
信息技术的发展加速了图书馆的信息化进程,图书馆在大数据时代已经具备了一定的大数据特征,主要表现在:(1)图书馆的数据来源广泛,数据类型复杂多样,既包括馆藏书目、订购数据库、自建数据库等结构化数据,还包括各类服务信息、利用信息、检索历史、浏览历史等非结构化数据,这些信息的格式无法统一、特征也不明显;(2)信息化程度的推进促使图书馆的信息量加速增长,单体图书馆的资源总量难以达到PB级,但区域图书馆的数据量却是一个庞大的数据集合;(3)随着个性化、学科化服务的深入与拓展,用户对图书馆的要求和期望也更高,图书馆也应据此做出转变,而这些转变可依托大数据的挖掘分析来实现;(4)自助设备(包括自助借还机、自助打印复印机、自助检索机、自助阅报机等)的广泛应用,加速了非结构化数据的产生[5]。
沈阳师范大学图书馆馆藏图书近140万册,年订购中外文期刊1 000余种,电子图书50万余种,中外文电子期刊2万余种,博硕士论文45万篇,各种多媒体音像资料2万多种,大型网络数据库24个,自建特色数据库15个;2012年实施大流通以来,自助借还机已达6台,自助打印复印机4台,自助阅报机4台,自助检索机24台。这些馆藏资源的利用和自动化设备的使用状态构成了庞大的数据体系,产生了海量的结构化、半结构和非结构化数据,对这些大数据的精准分析与深度挖掘,可以完整地勾勒出每一位读者的特征,将会为图书馆的服务理念、服务手段与文献资源建设等带来支持与改变,创造新的服务增长点。
3大数据驱动图书馆服务创新
依托大数据为基础的全方位智能服务体系主要是对图书馆产生的结构化、半结构化及非结构化数据的深度挖掘与分析,根据横向、纵向的分析结果为读者提供多种高附加值服务、智慧服务等。全方位智能服务体系的影响因素不仅取决于大数据的拥有量,还包括对大数据的挖掘与分析能力,沈阳师范大学图书馆智能服务体系的构成如图1。
31入馆数据的挖掘有助于服务的定向推送
调查统计显示,沈阳师范大学图书馆近三年读者入馆人次呈上升趋势,表明读者
文档评论(0)