- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在图书馆中的应用
摘要:在介绍数据挖掘技术的基础上,从资源建设、用户分析等方面探讨数据挖掘在图书馆服务管理中的作用及实施数据挖掘的具体过程。
关键词:数据挖掘;图书馆
中图分类号:TP311文献标识码:A 文章编号:1009-3044(2008)14-20796-02
1 引言
图书馆作为文献资源的提供机构,拥有大量的文献资源供用户使用。但随着图书馆馆藏文献的增多,会有这种现象发生:用户在众多的信息中,不知道哪一个才是真正需要的;随着用户的不断增多,图书管理人员发现,用户的需求千差万别,想让每一个用户都满意越来越困难。图书馆和用户之间的这种矛盾,成为当前急需解决的问题。其实,图书馆除了拥有大量的文献资源外,还拥有海量的其他信息。如:用户的基本信息、借阅信息、检索信息、咨询信息等。从这些信息中就能找到解决图书馆和用户之间矛盾的答案,这需要应用数据挖掘技术。通过对图书馆的信息资源进行数据挖掘分析,能发现隐含其中的潜在信息,可以帮助用户更好的使用图书馆的信息资源,帮助图书馆为用户提供更好的服务。
2 数据挖掘概述
2.1 内涵
数据挖掘(Data Mining)也叫数据开采、数据采掘等,是从大量的、不完整的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在而又有用的信息和知识的过程。通过数据挖掘,有价值的知识、规则或深层次的信息就能从数据库的相关数据集合中抽取出来,并从不同角度显示,使用户可以在信息的荒漠中更容易找到知识的绿洲,解决了用户“信息丰富而知识贫乏”的尴尬。
2.2 功能
2.2.1 趋势和行为预测
预测是根据数据对象的属性、过去的观察值对该属性的未来值进行预测。数据挖掘可以自动地从数据(仓)库中寻找预测性信息,根据时间序列数据,由历史的和当前的数据预测未来的趋势和行为。
2.2.2 关联分析
关联分析就是要挖掘隐藏在数据(仓)库中的数据关联关系或规则,即发现一个事件和其它事件之间依赖或关联的规律或知识。
2.2.3 分类分析
分类分析就是研究已分类资料的特征,分析对象属性,据此建立一个分类函数或分类模型,然后运用该模型计算总结出的数据特征,将其它未经分类或新的数据分派到不同的组中。
2.2.4 聚类分析
聚类分析是在事先不知道的条件下,根据对象的一些相似特征分组,根据事物本身潜在的特性把数据集合中的个体或对象按照相似性归结成若干类,从而将数据库中的记录化分为一系列有意义的子集。
2.2.5 孤立点分析
数据(仓)库中经常存在一些数据对象,它们与数据的其他部分不同或不一致,而且不符合数据的一般模型,这样的异常数据对象被称为孤立点。对孤立点进行数据分析称为孤立点分析,也称为偏差分析。
3 数据挖掘在图书馆服务管理中应用
通过数据挖掘技术并结合图书馆的服务管理工作,具体可应用于以下几个方面:
3.1 资源建设
合理的进行信息资源配置是图书馆管理工作的核心,是为用户提供优质服务的基础。资源建设主要包括图书文献资源的建设、网络信息资源的建设。无论是图书文献资源还是网络资源都存馆藏结构问题。在网络化、数字化的今天,不能单凭领导或专家的个人意见,决定采购哪些书目及书目的多少,应该通过数据挖掘技术对图书馆日常工作中产生的大量借阅信息、检索信息、咨询信息、馆藏书目信息等从多方面进行分析,发现并了解当前的文献结构还有哪些缺漏,及时进行补充。这样就可以利用有限的经费,进行有针对性的补充、丰富或剔除某些信息资源,进行合理的资源配置,满足用户的需要。
3.2 图书上架、信息资源存储
世界著名商业零售连锁企业沃尔玛(Wal Mart)意外发现“跟尿布一起购买最多的商品竟是啤酒”,并通过调查分析找到了其中的原因。于是沃尔玛就在其一个个门店将尿布与啤酒并排摆放在一起,结果是尿布与啤酒的销售量双双增长。图书馆的图书上架、信息资源存储和超市的商品上架一样,也是有规律的。所以,在图书馆的管理中,也应该对通过数据的挖掘、分析找到文献资源之间的相互关系,这样才能更好地进行图书上架及信息资源的有效存储。如:应该把哪些书籍放在一起、把信息资源按照什么方式进行存储更方便用户的查找。
3.3 用户分析
在企业理论中二八法则又称“马特莱法则”,是国际上公认的一种企业法则。即企业80%的利润来自20%的客户,而发展新客户所需费用是维持老客户的6~8倍。图书馆可以借鉴这一法则,利用数据挖掘对用户的借阅、咨询、检索等信息进行分析,从中找出20%的核心用户,并根据核心用户的信息需求,组织人力、物力资源,为他们提供周到、快捷、满意的服
文档评论(0)