我国大数据技术应用于图书馆的实践研究.docVIP

我国大数据技术应用于图书馆的实践研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
我国大数据技术应用于图书馆的实践研究   摘要:文章简要介绍了大数据技术,分析了图书馆应用大数据技术的必要性,从读者服务、自身业务工作两个方面对目前我国图书馆应用大数据技术的实践进行了总结,最后,指出了我国图书馆在大数据技术应用方面存在的问题,并提出对策。   关键词:大数据;大数据技术;图书馆   随着云时代的到来,由维克托?迈尔-舍恩伯格及肯尼斯?库克耶提出的大数据(big data)越来越多的得到社会各界学者的关注。大数据或称海量数据,是用来描述海量的结构化和非结构化数据的专业术语,包括业务流程数据、企业大数据、社会大数据、个人大数据和科学大数据等。利用大数据技术分析挖掘图书馆中的数据信息,改善图书馆日常业务工作,提升图书馆的服务水平已成为大数据时代图书馆提高服务质量的发展方向。   一、大数据及大数据技术概述   (一)大数据的涵义及特征   大数据一般指数据量在10TB(1TB=1024GB)规模以上的数据,与海量数据不同,大数据不仅代表着巨大的数据量,在数据流、结构化与非结构化数据的处理速度及效率上也是惊人的。大数据的本身没有意义,它的价值主要是通过数据挖掘及分析来体现。   大数据与过去的海量数据有所区别,具有数据量巨大、数据类型众多、价值密度低和处理速度快四大基本特征。   (二)大数据技术   随着大数据时代的到来,人们需要采用新一代的信息技术来对大数据进行分析处理,大数据技?g主要分为五大类。   1. 基础架构技术   基础架构技术主要包括支撑大数据处理的数据中心管理技术、云计算平台、云存储设备及技术等。大数据处理需要云数据中心和具备高效调度管理功能的云计算平台的支撑。   2. 数据采集技术   数据采集技术是进行数据处理的必备技术,对海量的数据加以利用的前提是通过采集技术把数据采集上来,采集的过程既包括采集、转换、加载等,也包括对数据的清洗、过滤、校验等各种预处理过程,这一系列的过程都需要采集技术加以支撑。   3. 数据存储技术   数据经过采集和转换之后,还需要进行存储归档。数据存储技术主要是将这些数据分布到多个存储节点上,数据存储技术还提供备份、访问接口等服务。   4. 数据计算技术   数据计算主要包括数据查询、数据统计、数据分析、数据预测、数据挖掘等各项相关的技术,这些同时也是大数据技术的核心。   5. 数据展现与交互技术   数据最终的结果是为人们生产、决策提供支持,因此需要恰当直观的将数据展示出来。数据展现除传统报表、图形等,还可以结合现代的可视化工具及人机交互手段,如手机APP等增强现实的手段,来实现数据与现实的无缝接口。   二、图书馆应用大数据技术的必要性   随着信息技术及数字技术在图书馆中的应用,图书馆资源数量越来越多,资源类型越来越复杂,资源内容越来越丰富,图书馆需要充分有效地利用这些数据资源,拓展图书馆的服务内容。   (一)图书馆工作符合大数据特征之处   1. 海量化的信息   据互联网数据中心的监测,全球在2010年正式进入ZB时代。与此同时,图书馆的资源收藏量也呈现出急速增长的趋势,从TB级别跃升到PB级别。北京世纪超星技术发展有限责任公司建设的超星数字图书馆,拥有数百万册电子图书,内容总量超13亿页,数据总量约达976.56TB,其图书资源量十分庞大;再如,国家图书馆资源类型十分丰富,不仅包括微缩制品、音像制品,还建成了中国最大的数字文献资源库基地,数字资源的数据总量超过1000TB,并以每年100TB速度增长;武汉图书馆截至2014年年底,馆藏文献总量达398万册,数字资源容量达到150TB。因此,目前我国许多图书馆从数据量上看已经具备了海量化的数据。   2. 多样化的数据   随着信息技术的迅速发展,由图像、声音、超媒体等信息组成的非结构化数据也随之产生并逐渐增多。图书馆经过多年的数字化建设,数据类型变得更加多样化,除了纸质文献外,还拥有大量的数字资源,以及各种光盘、音频、视频资源等。北京大学图书馆大量引进和自建国内外数字资源,其数字资源类型多样,包括各类数据库、电子期刊、电子图书和多媒体资源等,从结构上看主要包括半结构化和非结构化数字资源。武汉图书馆已建成集印刷文献、电子文献、微缩文献、视听文献、网络文献为一体,学科门类齐全、虚拟与实体馆藏相结合的多类型文献资源格局。综合国内图书馆具有的资源类型可以看出,图书馆已经具备了多样化的大数据特征。   (二)图书馆应用大数据技术的意义   1. 全方位数据推送服务   图书馆通过数据采集技术采集读者信息,利用大数据分析技术对读者的年龄、职业、喜好等采集到的数据进行分析,以不同层次读者的需求为出发点,根据不同类型人群的喜爱提供有针对性地全方位地实时信息推

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档