数据挖掘技术在校园卡信息管理系统中应用研究.docVIP

下载本文档

2
0
约4.63千字
约 10页
2018-06-23 发布于福建
举报
版权申诉

数据挖掘技术在校园卡信息管理系统中应用研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数据挖掘技术在校园卡信息管理系统中应用研究

数据挖掘技术在校园卡信息管理系统中应用研究　　[摘要] 随着科学技术的不断进步以及信息化时代的到来，信息化建设已经逐渐渗透到校园网络信息化平台的建设过程中，高校数据库共享信息资源平台的建设为各种高校的数据挖掘提供了坚实的技术基础。本课题以校园卡信息资源的数据挖掘为研究目标，通过目前比较先进的数据仓库技术、OLAP技术以及数据挖掘技术搭建了校园卡信息管理系统数据挖掘模型。　　[关键词] 数据挖掘；校园卡； OLAP；神经网络　　[中图分类号] TP391 [文献标识码] A [文章编号] 1673 - 0194（2013）04- 0079- 02 　　1 数据挖掘技术简介　　所谓的数据挖掘就是从很多先不是很完全并且模糊有噪声的随机数据中提取信息和知识的过程，这些信息和知识大多都是人们事所未知的，被隐含在其中的潜在并且有用的。由于当今的信息技术飞速的发展，被人们所积累应用的数据量急剧上升，应该如何从大量的数据中对有用的知识进行高质量的提取才是当务之急。我们所提到的数据挖掘技术就是为这种需求应运而生的，并且不断地发展强大起来。这也是知识发现很关键的一个环节。　　数据挖掘技术的主要任务就是关联分析、聚类分析、分类、预测、时序模式和偏差分析等。下面是对这些主要的任务做简单的介绍。　　1.1 关联分析　　在很早之前运用关联分析的方法是由Rakesh Apwal等人所提出的。关联就是两个或者两个以上的变量之间所存在的一定的规律特点。这种数据关联在数据库中是属于非常重要的并且是可被发现的知识。关联又可以大致的分为简单关联、因果关联以及时序关联。这些关联分析主要的目的是寻找数据库里面没被发现的隐藏着的关联网。可信度和支持度是用来度量关联规则相关性的两个关键的阈值，并且不断对兴趣度以及相关性等参数进行引入，使被挖掘的规则越来越符合需求。　　1.2 聚类分析　　所谓的聚类分析就是把相关的数据按照它们的相似程度归纳为若干个类别，其中相同类别中的数据具有彼此相似性，不同类别中的数据存在着差异。聚类分析建立的是宏观的概念，从数据不同的分布模式及可能的数据的属性间发现所存在的相互关系。　　1.3 分类　　分类大多是用规则或者决策树的模式表示，它会找出同一个类别的概念进行描述，对该类的内涵进行描述，它代表着此类数据整体的信息，并且用这种描述进行模型构造。分类就是一种分类的规则，这种规则是将数据集通过一定的算法而得出的。分类通常被用于规则的描述以及预测中。　　1.4 预测　　预测就是从历史的数据中找出一些变化的规律，并且建立相应的模型，用来对未来的数据特征及种类进行推测、预测。预测中通常用预测方差来度量预测的精度及不确定性。　　1.5 时序模式　　时序模式其实就是根据已知的数据对未来值进行预测。通过时间的序列对重复发生概率较高的模式进行搜索，所预测的未来值之间的区别就是它们所处的时间不同。　　1.6 偏差分析　　数据库中的数据是很复杂多样的，同时也是存在着很多的异常情况，若能够在数据库中发现异常的情况很重要。偏差中包含了许多非常有用的知识，寻找所观察的结果中与参照数据之间的差别是偏差检验的基本方法。　　2 数据挖掘技术常用方法　　2.1 神经网络方法　　神经网络是近几年逐渐流行的一种计算机技术，被很多研究学者用于各个领域的科学研究，其自身所具备的较高性能的自组织自适应性、分布存储、鲁棒性、高度容错以及高速并行处理等独特特性使得其发展以及应用空间非常巨大，数据挖掘问题的解决方案就迫切需要这些特性，因此，众多的学着逐渐将神经网络方法应用在数据挖掘问题的求解中，越来越得到人们的高度关注。神经网络模型比较多样，但是主要分为3个大类：第一种类可以称之为前馈式神经网络模型，其主要代表是函数型网络、bp反向传播模型以及感知机，其主要的作用是用于模式识别、预测以及各种分类；第二种类可以称之为反馈式神经网络模型，其主要代表是连续模型以及hopfield离散模型，其主要作用域是优化各种计算以及联想记忆；最后一个种类是自组织映射方法，其主要代表模型是koholon模型以及经典的art模型，其主要功能是用于聚类。除此之外，神经网络模型以及算法也具有其自身的局限性，即“黑箱”性，学者在研究的过程中并不能够深入地理解神经网络的自我学习以及决策过程。　　2.2 遗传算法　　数据挖掘方法中通常还会用到遗传算法，遗传算法是借鉴于自然界生物的基因遗传以及自适应机理实现目标的随机搜索，可以理解为一种仿生物的全局优化计算方法。遗传算法之所以在数据挖掘中得到应用，主要是因为遗传算法具备的与其余模型结合较容易、隐含并行性等特征。此外，与粗集、神经网络等计算技术相结合的应用也是遗传算法的主要应用方向之一，比如借