- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在图书管理中应用
数据挖掘技术在图书管理中应用
摘要:大学图书馆在日常的图书流通中会产生大量的读者服务数据,这些流通数据能够客观反映不同读者阅读习惯、读书兴趣等方面的规律和特点。数据挖掘技术中的关联规则、聚类分析、分类和预测分析等方法对发现和挖掘这些规律和模式有着独特的优势。把这些技术应用在图书管理中,可以发现图书流通环节隐藏的潜在规律,提高图书流通效率。同时为领导决策、馆藏图书配置以及文献结构体系建设提供科学的指导。
关键词:数据挖掘技术 图书管理 技术分析方法
中图分类号:G251 文献标识码:A 文章编号:1672-3791(2012)09(b)-0254-02
1 数据挖掘
随着各行业事务处理的计算机化,我们产生和收集数据的能力正在迅速提高。我们已经被各种数据所淹没,如科研数据、商业数据、气象数据、居民日常消费数据、图书借还历史数据……我们没有时间和精力把这些数据逐个查看。用什么手段来处理和应付这些数据已经成为我们当前的兴趣所在,因此我们就必须找到一套行之有效的办法,来对这些数据实现自动分类、分析和汇总,自动地发现和描述数据中的规律和趋势,并发现和标记数据的异常情况。数据挖掘技术的出现和发展,为我们提供了解决这一问题的有效方法。
数据挖掘是将隐含的、尚不为人所知的、同时又是潜在的信息从数据中提取出来,建立计算机程序,自动在数据库中扫描,以发现规律或者模式,即找出数据中的模式或规律的过程。这个过程是自动的或半自动的,数据的总量通常是相当可观的,同时从中发现的模式或规律需要是有意义的,并且能产生一定的效益。
数据挖掘通常又称为数据中的知识发现,是方便地提取代表知识的模式或规律;这些模式或规律通常隐含或记录在各种数据库、数据库集、网页日志、应用软件或通信数据流中。不能把数据挖掘看作是简单的数据库查询技术。数据挖掘要求在海量数据中,挖掘出的信息是新颖的、潜在实用的、正确的和最终是可理解的、并且是非平凡性的;它不同于在电话本上查找电话号码和在搜索引擎上查找特定的网页内容。数据挖掘技术可以通过分类和预测分析的方法对海量数据进行直接数据挖掘;也可以通过关联分析、聚类分析、描述和可视化分析,以及复杂数据类型,如信息网络、web、图形图像和音频视频等的分析来进行间接数据挖掘。如在对美国沃尔玛的购物篮分析,发现的啤酒和纸尿布之间存在的让人忍俊不禁的联系。
2 图书馆
功能强大的数据挖掘技术为每天面对数量庞大、分类众多的高校图书和不同口味、需求各异的服务对象的高校图书管理者提供了一个化腐朽为神奇的法宝。图书管理者在工作中充分发挥数据挖掘技术在图书管理、读者服务等方面的作用,不断实践广泛应用,必将实现图书管理工作的大变革和跨越式发展。就现在笔者所在学校的图书馆而言,与大部分图书馆构成大体一样。我们学校的图书馆包括职能部门:采编部、流通部、技术部、期刊部和参考咨询部;教学研究部门:信息检索教研室、信息检索研究所;行政部门:办公室及馆长。简称“五部一室一所”,部门各自的作用仅从它们各自的名字便可粗略得知。这里只就两个主要部门做简单介绍。采编部主要负责图书馆新进图书的前期采访、采购和后期加工,如分类、编目、录入、分库、入库等工作。流通部主要负责文学书库、艺术书库、外文书库、中文工具书库、自然科学书库、社会科学书库及样本书库等书库的日常管理和图书流通工作。
3 数据挖掘技术的应用
3.1 图书流通中的应用
频繁模式是频繁出现在数据集中的模式。关联规则是从频繁模式产生的最常见的一类规则。用关联规则对不同读者的日常借阅历史目录进行跟踪分析,从这些海量借阅历史目录信息中挖掘,发现各类图书间存在的关联,总结不同读者的兴趣。通过各类图书这种关联关系的支持度和置信度正确计算分析,可以得出异类图书间的关联规则。通过深入研究各专业读者的读书学习习惯,可以为图书馆领导科学决策、高效管理提供现实依据,为图书管理员日常管理工作中的新书分库和图书的异类排架等方面提供科学有效的参考,从而提高图书馆图书借阅效率,为高校广大师生提供更加科学、高效、人性化的服务,最终达到读者面对图书和图书面向读者的目的,实现读者和图书间的和谐。
具体而言,如用数据挖掘软件对读者借阅历史的数据挖掘发现,近年来出现的一个出乎大家意料的现象,很多理工科的学生在大三时期,频繁的借阅经济类的书籍,特别是与考研相关的经济专业图书。后来通过软件分析和实践调研得知,由于近年来大学生毕业人数不断攀升,就业压力逐年加大。很多大学生为逃避就业选择了考研,而高等数学、概率统计在而经济类研究生入学考试中占有很重要的作用,理工类比经济专业学生在数学科目考试中占有明显优势,容易考取。因此,就有很多理工类学生在大三时期,选择了报考经济类研究生。于是在学过本专业,确保顺利毕业的同时,挤出大量课
文档评论(0)