- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘在图书馆信息服务中作用
数据挖掘在图书馆信息服务中作用摘要:本文探讨了数据挖掘在数字化图书馆中的应用,说明数据挖掘技术在数字图书馆应用的必要性,以及在提升图书馆服务质量和服务水平方面的发挥的重要作用。
关键词:数据挖掘 图书馆 服务
中图分类号:G25 文献标识码:A 文章编号:1008-925X(2012)O9-0160-01
一、数据挖掘的定义
数据挖掘又称数据库中的知识发现,是目前信息技术领域中的一个热门课题。所谓数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。何为知识?从广义上理解,数据、信息也是知识的表现形式,但是人们更把概念、规则、模式、规律等看作知识,把数据看作是形成知识的源泉,好像从矿石中采矿或淘金一样。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理、查询优化、决策支持和过程控制等,也可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、数理统计、可视化技术等方面的学者和工程技术人员,投身到数据挖掘这一新兴的研究领域,形成新的技术热点。
二、数据挖掘在图书馆服务中的作用
2.1提高信息获取速度
为保证用户在尽可能短的响应时间内获取所需信息,首先可以收集用户每次阅读的专题集合(浏览模式)作为一个事务,记录所有用户每一次浏览过程构成事务库,再对事务库进行如下操作:第一,利用关联规则采掘算法找到访问频率超过给定阈值的专题(项目)集,进而用分类算法把客户的浏览模式与频繁项目集进行相似匹配,将具有相似浏览模式的客户组织到一个服务器上,从而减少服务器缓存和传输页面的数量;第二,找到事务库中被频繁访问的专题集,利用关联分析得到专题之间的关联规则,存入服务器的知识库,当用户浏览某页时,网络代理根据规则预先连接其关联页,从而提高响应速度;第三,也可利用Web挖掘得到用户访问序列模式,根据预测预先传输用户可能阅读的页面。
2.2提升图书馆传统信息服务的质量
如同网络向智能化方向发展一样,信息服务也应“智能化”,即由被动服务转向主动服务,由单纯的信息呈现转向信息生成。一是信息检索服务。传统的检索工具缺乏结果的友好性,可理解性和交互性,往往将一大堆查询结果线性呈现,令用户不知所入;智能化的信息检索不仅支持概念检索、模糊检索、联想检索及多语言检索等,而且能迅速利用聚类算法将查询结果分析聚类,使之条理化呈现,方便用户筛选,同时在此基础上确定进一步的检索定位,例如系统提示“Limited yourresearch to result within one of the followingcategories”,从而实现交互式检索。二是定题与查新服务。这两种常用的针对科研的信息服务,其传统方式是检索文献或光盘数据库,然而在网络时代,我们更不能忽视对外部网络这一即时便利的信息发布平台的搜索,以确保查新结果的可靠性。同时,数字图书馆可应用兴趣模式算法判断并争取潜在用户;在服务过程中,还可利用可视化技术等帮助用户进行在线实时信息分析。三是信息分析服务。基于此,数字图书馆可提供面向商业用户的信息分析,帮助它们确定发展和竞争策略,实现自身的收益。
2.3支持图书馆的决策管理
管理水平低下是影响我国图书馆事业发展的重要因素之一,管理水平的提高很大程度上取决于决策的科学与否。传统的图书馆决策方式大多依靠经验进行决策,存在主观、片面、盲目等诸多问题,无法适应时代发展的要求,采用数据挖掘技术能够为领导层的科学决策提供强有力的保障。首先,数据挖掘能将涉及图书馆这一信息系统的各种内部数据和外部信息汇集起来,经过处理和转换,形成集中统一、随时可用的决策信息,防止因信息不足造成的错误决策。其次,利用数据仓库系统提供的OLAP工具可以对集成数据进行多维分析比较,对决策假设进行审查和验证,提高决策的可靠度和可行性,达到合理利用有限资金,优化图书馆的资源配置的目的。第三,数据挖掘工具可以从历史数据中找出潜在的模式,并在模式的基础上自动作出预测,这对启发图书馆决策者的创新思维,应对信息化社会的挑战具有重大意义。
2.4支持图书馆的业务工作
一是采访部门。采访部门职能发挥的好坏关系到图书馆资金及资源利用率的高低,如何利用有限的资金采购高质量的书刊,保障图书馆信息资源体系的科学性和合理性,是图书馆工作的重中之重。因此,准确地定位读者对象的需求就成为提高资源利用率的一个重要因素,比如一所师范院校图书馆,它既要满足专科类较低层次的读者,又要满足博士生及导师的
文档评论(0)