- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大数据的数字图书馆信息服务研究doc
基于大数据的数字图书馆信息服务研究
摘要:随着网络技术应用的普及,产生海量的数据信息,针对大数据对数字图书馆信息服务的影响,将大数据技术应用于数字图书馆的信息服务中,为用户提供个性化信息的服务。研究了基于大数据技术的数字图书馆信息服务内容和模式,将大数据技术融入数字图书馆信息服务能为用户提供更细致,更个性化的信息服务。
关键词:云计算 大数据 hadoop 数字图书馆 信息服务
中图分类号:G250.76 文献标识码:A 文章编号:1007-9416(2015)07-0000-00
1 概述
随着数字化信息的增多,以及用户本身上传、下载等操作所产生的大规模的数据,使数字图书馆逐渐呈现“大数据”的特征。用户获取信息的方式的变化,也对数字图书馆的信息服务提出了更高的要求,想从结构复杂,种类繁多的大量数据中,快速获取用户需求的有价值的信息,就需要大数据处理技术的支撑,如云计算等。大数据具有规模性、多样性和高速性的特征。大数据的数据结构就包括结构化的数据,半结构化的数据和非结构化的数据,能大规模快速处理数据流,能满足用户的个性化信息需求,这就是大数据和数字图书馆的契合点。将大数据对数据处理技术应用于数字图书馆,数字图书馆的大数据的架构主要从数据采集、数据存储、数据处理,数据分析及数据应用四个层面进行如图1所示。
2 基于大数据的数字图书馆的数据信息服务内容
基于大数据的数字图书馆信息服务内容将从信息资源的发现,信息资源存储,信息资源组织和信息资源检索四个方面进行探索,研究大数据对数字图书馆信息服务的影响。
2.1 信息资源发现
在大数据环境下,数字图书馆的信息资源丰富,数字资源存储在结构不同的数据库中,分布广泛,数字图书馆信息服务就是利用大数据技术挖掘分布广泛的大量异构的数据信息资源之间的关系,为用户提供满足其所需信息资源。首先要利用大数据技术发现和处理数字化信息资源,包括馆藏信息资源和用户信息资源。对用户行为信息和用户信息需求进行挖掘,挖掘出用户的信息行为与数字化信息资源之间的潜在关系,从而为用户提供更好的信息服务。在大数据环境下,数字图书馆的信息资源发现有用户行为发现和用户信息需求发现。数字图书馆的信息资源发现模式如图2所示。
对用户行为的发现通过用户网站注册的信息,如用户的姓名、性别、年龄、知识结构等信息,通过对这些信息的发现、采集、去重等处理后获取用户的信息,也可以通过与用户实时交流沟通获取用户的信息,填写问卷调查表获取用户的信息,将用户的这些信息录入数据库中,为用户建立用户个人信息库存储在服务器上。
对用户信息需求的发现。对用户信息需求的发现是建立在对用户行为的基础上。可以利用大数据挖掘技术对用户的行为如浏览的网站、检索留下的痕迹、下载的数字化信息资源、分享的信息资源、评价信息等挖掘,发现用户真实的信息需求和潜在的信息需求,并为用户建立用户需求匹配资源库,通过分析为用户提供页面定制、信息推送服务、学术信息导航服务和参考咨询服务等个性化的信息服务。在大数据环境下,数字图书馆海量的数字信息形成了庞大的数据仓库,根据用户访问的系统日志,通过数据挖掘技术和数据分析技术找出用户对不同主题的信息资源的需求,大数据能实现对实时动态的数据进行处理和分析。对用户在网络上的浏览历史、检索关键词等信息进行分析和挖掘,发现用户个性化的信息需求。有助于图书馆对读者的信息需求和信息个性化服务,真正实现用户个性化信息服务和定制化信息推送。
2.2 信息资源的存储
在大数据环境下,如何解决呈爆炸式增长的数字化信息资源数据的存储问题,更好的满足用户的个性化信息服务。由于海量数据信息的数据结构不同,应用云计算平台的数据存储技术可以解决异构的数据存储问题。它的存储空间是无限制的,可以实时更新数据。
2.3 信息资源组织
海量的数字图书馆信息资源包括馆藏实体信息资源、虚拟信息资源和网络信息资源等。数字图书馆作为一种可检索复用的庞大信息系统,海量的数字图书馆信息资源为用户提供可检索和操作的入口,从而达到利用数字资源的效果。为了便于用户获取有效信息资源,进行信息共享,面对多种结构的数据信息,需要对数据进行处理,将搜集的信息经过科学的优化、加工和分析整序,使数据呈现出一定规律便于有效利用。可以利用流处理和批处理方式来进行信息资源组织。大数据信息资源组织流程如图3所示。
2.4 信息检索
基于大数据的数字图书馆如何快速高效地检索信息,为用户提供个性化的信息需求服务是目前研究的一个难点。大数据环境下,数字图书馆的数字化信息数量大,种类多,数据价值联系低,就要求搜索引擎实现智能化实时优化需求,个性化搜索,满足移动搜索的需求。准确定位用户真正的信息需求,真正实现用户个性化信息检
您可能关注的文档
- 城市建设与城市管理和谐发展对策研究.doc
- 城市排涝泵站建设中的规划设计要点分析.doc
- 城市排水系统规划城乡园林规划工程科技专业资料.ppt
- 城市污水处理项目的风险分担及收益分配研究.doc
- 城市用地空间布局城市空间布局的基本原则.doc
- 城市燃气输配镀锌管的焊接质量控制.doc
- 城市美容师教案说课稿.doc
- 城市轨道交通工程技术毕业设计隧道下穿胶济铁路便梁架拆挖孔桩施工专项施工方案.doc
- 城市设计的创作建筑规划论文.doc
- 城市道路排水城市道路排水设计分析.doc
- 基于建构主义的桂西北壮母语地区大学英语教学模式探究.doc
- 基于心理帐户视角的居民消费行为研究以股市行情影响居民消费为例的论文.doc
- 基于形式焦点理论的对外汉语初级阶段把字句教学研究.doc
- 基于扩大内需的中国农村居民旅游市场开发研究 学术资料旅游管理理论.doc
- 基于心理帐户视角的居民消费行为研究以股市行情影响居民消费为例.doc
- 基于工程量清单计价的房地产项目工程造价管理模式研究开题.doc
- 基于改进型广义双曲正切模型的机器臂控制算法研究.doc
- 基于感性工程学的电子天平外形设计.docx
- 基于数字PID的电阻炉温度控制系统设计课程设计任务书.doc
- 基于数码相机的定位的模型研究.doc
最近下载
- 一种辊内冷却的辊压机.pdf VIP
- 公司内部网络安全和设备管理制度(定稿).docx VIP
- 老友记台词剧本第一季第1集中英双语左右对照.pdf VIP
- 2021年第二届全国矿山安全普法网络知识竞赛题库(试题101-200题).pdf VIP
- 五公司2012年统战工作总结(国企版).doc VIP
- 011锂电池行业数字化转型MES整体解决方案.pptx VIP
- 道路改造工程施工组织设计 施工组织设计.doc VIP
- 水文监测数据通信规约SL651-2014.pdf VIP
- 2024最新光伏项目财务测算模型(14张表格数据自动计算).xlsx VIP
- 劳动力市场和新资调查报告2024-2025.docx
文档评论(0)