高校图书馆馆藏管理中的数据挖掘研究.docVIP

下载本文档

5
0
约2.98千字
约 6页
2016-09-27 发布于北京
举报
版权申诉

高校图书馆馆藏管理中的数据挖掘研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

高校图书馆馆藏管理中的数据挖掘研究.doc

高校图书馆馆藏管理中的数据挖掘研究　　【摘要】本文分析了高校图书馆馆藏管理的特点，在此基础上提出了基于高校图书馆馆藏管理的数据挖掘系统模型，并进一步讨论了系统流程与功能模块构成。　　【关键词】数据挖掘；高校图书馆；系统模型　　1 数据挖掘和知识发现　　数据挖掘，就是从大型数据库的数据中提取人们感兴趣的知识。这些知识是隐含的、事先未知的潜在有用信息，提取的知识表示为概念、模式、规则、规律等形式[1]。　　知识发现是从大量数据中辨别可信的、新颖的、潜在有用的并能被人所理解的模式的高级处理过程。　　数据挖掘和知识发现是随着数据库、数据仓库、机器学习、互联网等信息技术的发展而兴起的。　　2 数据挖掘在高校图书馆馆藏管理中的应用　　作为教学与科学研究服务的学术性机构，高校图书馆功能可以分为两大类，一类是信息输入工作，即文献的搜集、整理和组织典藏工作，也称文献资源建设工作；一类是信息输出工作，即文献的使用和服务工作，也称读者服务工作。这两部分工作共同构成了图书馆的业务工作体系[2]。　　数据挖掘技术在高校图书馆馆藏工作中的应用，可以总结为三个方面：　　2.1 高校图书馆馆藏管理决策中的应用　　目前高校图书馆普遍采用了自动化集成管理系统，数据库的信息容量庞大，依靠人工找出有价值的信息是不可能的。利用数据挖掘技术对数据库进行挖掘，进行科学合理地分析，得到有效的决策支持信息指导图书馆各项业务工作，为领导者科学决策提供支持，是高校图书馆发展的趋势之一。　　2.2 文献采访工作、图书馆文献资源建设中的应用　　如何使用有限的资金发挥最大的作用一直是高校图书馆建设的一个难点问题，通过对流通数据、检索记录、咨询记录进行整体挖掘，可以得知哪种类型的图书缺口比较大，哪些已经接近饱和，这些信息为图书馆的文献采集工作指明方向。　　2.3 为读者提供个性化服务中的应用　　通过对流通数据库中的历史记录进行挖掘分析，发现隐含在其中的知识，归纳出读者的借阅规则和兴趣，结合读者的个人注册信息等，利用关联规则、分类、聚类等技术对借阅的历史记录进行挖掘，对于不同的读者群，确定不同的有针对性的推荐服务。如学计算机的读者借了一本《数据库系统概论》，为其推荐此书的相关书籍。　　3 基于高校图书馆馆藏管理的数据挖掘系统模型的设计　　现今高校图书馆自动化系统一般划分为以下几个子系统：一是文献采访管理子系统；二是文献编目子系统；三是流通管理子系统；四是联机书目检索子系统；五是连续出版物管理子系统；六是参考咨询子系统。建立了这些子系统的计算机集成管理系统构成了图书馆自动化的主要内容[3]。　　利用数据挖掘技术中的关联规则、分类、聚类技术等设计一个高校图书馆馆藏推荐系统模型，对高校图书馆尝试运用数据挖掘技术。　　3.1 高校图书馆馆藏管理的数据挖掘系统模型的整体架构　　如图1所示，高校图书馆馆藏管理的数据挖掘系统模型[4]包含了数据仓库、数据挖掘引擎、用户界面三个层次。　　第一层为数据仓库，从高校图书馆集成管理系统中的数据库中提取出的一段时间内的包含所要研究字段的数据，经过数据预处理以后，存储在这一层，再经过一系列的净化处理转变成事务数据库的数据样式，传送给第二层的数据挖掘引擎。　　第二层为馆藏推荐系统模型的核心，即数据挖掘引擎，通过一系列的具体代码实现数据挖掘的技术和算法，用来分析从上一层传过来的数据，得出结果传给第三层。　　第三层为用户界面，用户通过界面与系统模型交互，用户可以依据挖掘的需要灵活设置多种参数，如时间段、读者证件号、最小支持度等以产生比较准确的结果提供给读者。　　3.2 高校图书馆馆藏管理的数据挖掘系统的工作流程　　如上所示，系统有三层，整个工作流程为：从高校图书馆集成管理系统提取数据存入数据库；把经过数据预处理过的数据存入数据仓库；实施数据挖掘技术，将结果提交显示结果与图书馆OPAC进行无缝连接，与读者交互。　　馆藏推荐系统的第二层数据挖掘引擎部分综合运用了数据挖掘技术中的关联规则、分类技术、聚类技术等，核心模块是关联规则挖掘模块和读者分类模块。　　3.2.1 数据的收集和数据预处理　　首先确定时间段，考虑实际情况，选定一个学期。对导出的数据，进行数据的清理，将不符合挖掘需求的、多余的数据删除；对符合挖掘要求但是不符合事务数据库格式的，进行必要的转换。对于有的读者在一段时间内重复借阅而产生的多条记录，视为单条记录。原始数据经过数据预处理后存入流通数据表待挖掘模块调用。　　3.2.2 数据库的设计　　按照系统与读者的需求，设计了读者资料表、流通数据表和读者子群表等各类数据表9张，见表1。　　4 基于高校图书馆馆藏管理的数据挖掘系统结构