- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字挖掘技术在图书馆中的应用.doc
数字挖掘技术在图书馆中的应用
摘 要
在数字信息时代,一个人要想完全不泄露个人信息是不可能的,而我们利用数据挖掘技术获取这些信息并进行分类整理和分析,就能为各领域的工作谋取相关的利益。本文仅从现代图书馆的建设出发,详细阐述数据挖掘技术在图书馆用户资源管理、书籍采购及摆放、个性化推荐服务三方面的应用,希望图书馆能在数据挖掘技术的辅助下吸引更多的读者,为读者提供更贴心、更优质的服务。
【关键词】图书馆 暑假挖掘技术 应用 管理
1 发现并管理用户资源
用户数据按数据类型可大致分为用户描述类数据、用户行为类数据、用户需求类数据和用户反馈类数据四个大类,随着数字图书馆的不断发展,图书馆在获取用户数据的渠道、速度、数量等方面也在不断优化,既可以通过传统方式获取,也可以通过现代化的方式即数据挖掘技术获得。
在数字图书馆服务过程中获取用户进入图书馆借书都会办理借阅卡,卡上除了有用户的基本信息如姓名、联系方式、借阅等级以外,还记录了他们在持卡期间所借阅书籍的名称、编号、分类、借阅时长等。
另外,现在的图书馆都配有电子检索仪器,借阅者在检索过程中所输入的关键字也透露着他们的阅读偏好,是一个有用的信息。但是搜索很多时候是匿名的,所以我们可以灵活地利用IP地址?泶?替读者标识,统计每台机器在相应检索时间内各检索字段的条数。所以在利用数据挖掘技术进行用户信息挖掘和管理的时候,我们主要要做的工作就是将每一个用户的基本信息与其所借阅的书目信息及检索历史一一匹配, 编辑入库、定时更新。之后再将这一个个的信息聚合,做好详细的分类,构建起一个专门的用户数据管理库。针对数据库中的用户数据,采用简单关联、时序关联、因果关联等关联分析与序列规则等数据分析与挖掘方法,对图书馆用户特征进行多维特征分析,挖掘用户的隐性信息需求,从而为下文中将要谈到的图书采购、藏馆布局、个性化推荐服务打好基础。
2 优化图书馆藏书和布局
图书馆的藏书可分为过往藏书和近期藏书,过往藏书的数量一般是近期藏书的数倍,占用的空间的大得多。但是根据借阅情况来看,过往藏书的借阅量远不如近期藏书,查找起来也相对费时费力。但即使是在近期藏书中,也存在着热门书刊和冷门书刊之分,图书馆每年的书刊购置费都是十分有限的,若盲目购置则会造成资金的浪费和书刊的闲置,资源得不到有效利用。
传统的图书馆在采购时大多通过出版社、书店等渠道来了解新书书目和销售情况,却没有实际针对本图书馆所面向的客户群做一个专门的分析,采购的意见也多由馆长或个别专家来决定,不可避免地带有强烈的个人意志。而利用数据挖掘技术,我们可以对网络上无序的、非结构的数据进行采集和分类,通过搜索量及舆论对新书的受欢迎程度做一个预计,同时根据本馆借阅者的借阅偏好整理出他们所喜爱的图书分类,加大该类目书刊的采购比例,利用有限的经费科学采购。
除此之外,时间也会对读者的借阅行为产生一定的导向性,比如在奥运会期间,运动、世界史、旅游等方面的书的借阅量就明显上升,各类考试的前期,其相关的辅导书刊的借阅量也会随着开考时间的临近而逐渐上升,所以图书馆在采购时要综合各方信息、充分考量,使经费最大程度发挥效益
另一方面,为方便读者查找书目、快速完成借阅,图书馆还可而利用数据挖掘技术对图书馆的借阅流通记录、检索请求、分类统计、文献拒借集、频繁借阅集、借阅时长、归还时间等数据进行分析,得到同一类目下书籍被借阅频率的高低并进行排序。那么我们就可以据此重新安排图书馆的书架布局,将借阅量大、借阅频率高的书籍放在显眼位置、靠近出入口的地方,这样不仅能节省借阅者的查找时间,也能减轻图书管理员的上下架强度, 一举两得。
3 为读者提供个性化的推荐服务
在图书馆巨大馆藏中,读者感兴趣的书目只有很小的一部分,虽然现代图书馆提供的检索服务能够帮助读者在输入关键词后在查询结果浏览到相关书目的信息,引发他们对其他书刊的兴趣,临时增加借阅量。但这行为的发生取决于借阅者的主动检索,图书馆对其行为的导向几乎不存在,处境十分被动。而图书推荐服务就是为弥补这一局限性而采取的主动向读者提供信息的方式,它降低了对读者的要求,同时提供了更丰富的信息。图书推荐服务是现代图书馆个性化信息服务中的一种,它旨在为读者推荐他可能会感兴趣的书目,以增加额外的借阅量,同时也可以起到引导读者关注某一领域发展的作用,如在人民代表大会期间,图书馆就可为读者推荐与革命历史、政治制度、名人自传等相关的图书,与这一特殊的时间点相结合就有可能激发读者本没有的阅读欲望,从而提高某类图书的借阅量,增加活跃度。
为了提供个性化推荐服务,我们可以通过对借阅记录中读者信息和书籍信息的关联分析,找出读者的阅读偏好和借阅习惯,获取“不同类型的读者喜欢哪类书籍”
文档评论(0)