大数据技术应用于高校图书馆个性化服务探讨.docVIP

下载本文档

15
0
约3千字
约 7页
2018-09-01 发布于福建
举报
版权申诉

大数据技术应用于高校图书馆个性化服务探讨.doc

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

大数据技术应用于高校图书馆个性化服务探讨

大数据技术应用于高校图书馆个性化服务探讨　　摘要：大数据时代，数据无处不在，大数据技术可挖掘数据中蕴藏的价值，随着大数据思维的不断渗透，如何促使图书馆更健康的发展，必须要学会应用大数据，将大数据技术融入到图书馆工作、服务中去。　　关键词：大数据技术高校图书馆个性化服务　　中图分类号：G250 文献标识码：A 文章编号：1672-3791（2018）01（b）-0254-02 　　移动设备、RFID、无线传感器时时刻刻都在产生数据[1]，并以每年50%的速度急剧增长，要处理的数据信息量巨大，传统的技术手段已无法满足大数据时代业务需求和市场竞争压力对数据处理的实时性、有效性均提出的更高要求。因此，大数据技术的概念被提出，并迅速成为研究的热点，引起了普遍的关注。　　1 大数据概述　　早在1990年，数据仓库之父Bill Inmon就开始关注Big Data[2]；2008年9月《Nature》杂志发表“Big Data： Science in the petabyte era”，大数据一词正式被提出；2012年3月，美国启动“big data research anddevelopment initiative（大数据研究和发展计划）”；2012年7月，日本推出“新ICT战略研究计划”；2015年8月19日，我国通过了《关于促进大数据发展的行动纲要》。大数据至今尚无确切、统一的定义。人们主要是用它来描述和形容信息爆炸时代产生的海量数据。如今，大数据一词越来越多地被提及，主要指利用新的技术和处理模式解决具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息。　　大数据技术已广泛应用于电信、金融、教育、医疗、电子商务甚至政府决策等领域。近几年，图书馆人也渐渐开始探索大数据技术在图书馆方面的应用，作为全新技术（信息技术）架构起来的数字图书馆，与传统图书馆相比，其功能、职能已得到极大的拓展，但随着大数据技术对数字图书馆的不断渗透，如何促使数字图书馆更健康的发展，需理解大数据，适应大数据，学会应用大数据，将大数据技术融入到数字图书馆的应用中去[3]。　　2 革新高校图书馆信息服务的理念和思维　　随着大数据时代的来临，高校图书馆信息服务不再是靠理念和经验来传承，而是用数据说话，大数据充斥在图书馆的每一个角落，诸如读者每一次图书、期刊的借还，图书馆网站的每一次访问记录等都可以转化为数据。大数据比起传统的数字具有深刻的含义和价值。如读者与图书的关联，图书与图书的关联等。通过对用户的学科、偏好、使用习惯等数据信息特征的分析而主动向用户提供可能需要的信息和服务。　　3 大数据技术在高校图书馆个性化服务中的应用　　高校图书馆要实现个性化服务，就必须动态地组织和呈现与用户当前信息需求最相关的信息内容，即通过了解用户的访问模式，自动地改进站点信息的组织和显示。下面通过大数据技术的流程，来描述大数据技术在高校图书馆个性化服务中的应用。　　3.1 确定目标　　通过在图书馆已有的信息服务平台及服务模式的基础上，整合代表高校师生对信息需求和特点的所有数据的相关记录，实时感知用户变化着的信息需求，进而针对用户的真实信息情境开展有针对性的个性化信息服务。　　3.2 大数据的采集　　大数据采集必须要从多维度提取数据来源来接收发自客户端（Web、App或者传感器形式等）的数据，包括从外部互联网（直接装载入爬虫引擎）和图书馆内部（评估数据采集和对接方式）；除了传统的结构化数据资源（电子图书、期刊、论文数据库等）外，更加注重使用现代技术手段获取用户使用图书馆的过程中的半结构化及非结构化的数据信息（智能设备数据、物联网数据、互联网数据等）。　　3.3 大数据的导入/预处理　　原始数据大体上都是分散的、不完整、不一致的“脏”数据，无法直接进行有效的分析，为了提高数据分析的质量必须要进行大数据的导入/预处理等前期工作。数据的导入是将数据导入到一个集中的大型分布式数据库或者存储集；数据预处理有多种方法：数据清理、数据变换、数据集成、数据归约等。　　3.4 大数据的统计/分析　　统计/分析主要利用分布式数据库或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等。统计/分析的方法包括假设检验、差异分析、相关分析、聚类分析等等。大数据分析性能的好坏，与问题的性质、数据集的特性包括数据规模、数据特征等都有关系。　　3.5 大数据的挖掘　　数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中揭示出隐含在其中的先前未知的并有潜在价值的信息和知识的过程。挖掘的任务主要是分类、预测、关联分析、聚类分析等；挖掘的对象有关系数据库、面向对象数据库、多媒体数据库、数据仓库等。数据挖