- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
浅析数据挖掘技术在高校图书馆管理系统中的应用
浅析数据挖掘技术在高校图书馆管理系统中的应用
摘要:社会的发展和时代的进步推动了知识经济时代的到来,人们生活水平的逐渐提高对精神文化的需求也越来越大。因此,随着我国高等教育的普及,高校图书馆的管理成为了各大高校共同关注的话题。传统的图书管理工作只是将所采集的数据进行了简单的存储,而并未对其进行了深入地分析并利用。现代新型技术的发展为我国各大高校的图书馆管理提供了良好的平台。数据挖掘技术作为现代化信息技术的代表,为我国高校的图书馆管理带来了极大的便利。笔者在文中通过对数据挖掘技术进行了简单地阐述,进而分析了数据挖掘技术在高校图书管理系统中的需求,并对数据挖掘技术在高校图书馆管理系统中的应用进行相关探究,希望能够促进我国高校图书馆的有效管理。
关键词:数据挖掘技术 图书馆管理系统 个性化服务
一、 引言
现代社会的蓬勃发展带动了信息技术的快速发展,网络信息数据库的规模和范围不断扩大,已从单一的记录发展到整个网络,使得各大高校图书馆多年的资料在短短时间内迅速积累了海量的数据。要对海量的数据资料进行指定项目的检索犹如大海捞针,因此需要更加准确的检索工具。我国的各大高校中的图书馆主要是为教师和学生提供教学和学习的资源并且为相关的优秀科研活动提供合适的环境。然而,各大高校中的图书馆在管理的过程中会受到各种内外因素的影响导致图书馆在为读者提供服务的过程中产生矛盾。高校图书馆的管理工作因为地管理方式的过时和错误的服务方式对图书的管理造成了一定的困难。高校图书馆的传统管理方式只是侧重于对图书的借阅和归还程序进行系统登记,缺乏对相关的数据进行采集和分析。因此许多数据中所隐含的信息资源往往会被忽略[1]6。数据挖掘技术是迎合当代需求而诞生并迅速发展起来的一项高科技手段,将数据挖掘技术的基本理论与高校图书馆管理进行实际的结合,有助于高校图书馆对资源进行更好地管理从而来达到优化高校图书馆管理的目的。
二、 数据挖掘技术的相关综述
1.数据挖掘技术的概念
数据挖掘技术主要是指在数据库当中将许多的知识纳入相关的体系当中(如下图1所示)。数据挖掘技术的概念产生于20世纪的八十、九十年代的美国。数据挖掘技术指的是建立一个特定的数据集合来件各种领域内的知识进行提炼,根据不同的知识结构运用不同的数据挖掘计算方法并总结和归纳这些数据所呈现出来的规律以更好地解决以后出现的类似数据问题。数据挖掘技术是从大量的、不完全的有噪声的、模糊的、随机的数据中进行检索,并提取其隐含在其中的人们不知道的,但又是潜在有用的关系和规律的一个综合性过程,是统计、在线分析等数据分析工具的一个有效补充。这个过程类似于淘金,从一个多元性的整体数据库中对所需要的信息数据进行筛选检索,最终得到有用的信息和知识。在我国的各大高校的图书管理系统中会通过数据挖掘技术来建立一种数据关系,这种关系涉及的知识范围非常广泛并且可以通过相关数据对读者来进行进一步地细分。高校图书管理工作人员可以对这些数据进行整理和分析从而发现不同的读者所具有的个性化特征以提高数据挖掘技术的利用机制。
图1:数据挖掘技术的过程示意图
2.数据挖掘技术的功能和特点
近年来,各领域研究人员不断的对数据挖掘技术进行研究,并且致力于开发出智能化的信息检索工具。数据挖掘技术中的数据源必须是真实的、大量的、是用户感兴趣的、可接受的、可理解并且能够运用的。因此,所开发出的智能化信息检索工具必须具有以下所述的几点功能特点。(1)定义及类别的描述:定义的描述是指对特定对象用简单易懂的词汇、语言来对其的特点进行描述。类别的划分是根据所描述对象的特点进行群体的分门别类。定义主要侧重于相同对数据群的共有特点的描述,而类别的侧重点则在于不同数据对象之间的区分。(2)关系发现:关系发现是指对不同的信息变量之间存在的内部关联和潜在规律进行发现处理。关系发现又可细分为简单关系、时序关系以及因果作用关系三种类型。该功能在购物篮、商务管理和决策分析方面应用普及,是一种较受欢迎的数据挖掘手段。(3)归类及预估:对信息数据进行归类和预估都需要在信息处理前期进行有指导性意义的习得性操作,建立一套规则或模型。归类主要用于对散在分部信息的估算,而预估是用于对连续信息的估计。归类的常用方法有决策树、贝叶斯公式、神经网络、遗传算法、粗糙集和模糊集等,预估的常用技术是线性回归和非线性回归两种。(4)聚合研究:聚合是指对信息进行由类似数据组成的多个类别的区分,样本是依照组内的最高相似程度、组间的最小相似程度进行归类划分的。它与归类的主要区别在于该功能是无指导性意义的习得性操作,在对信息对象研究时,研究对象的类别是无法预知的。一般可通过对类别的划分、分层、密度主导、网格主导以及模型主导等手段来进行聚合研究。(5)孤立点分析:孤立点通常用来指代不满足信息的常规行为或一般模型。孤
文档评论(0)