数据挖掘在高校招生信息化中的运用.docVIP

下载本文档

2
0
约3.96千字
约 3页
2016-11-18 发布于河北
举报
版权申诉

数据挖掘在高校招生信息化中的运用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数据挖掘在高校招生信息化中的运用

数据挖掘在高校招生信息化中的运用　　摘要：数据挖掘是一门交叉性学科，它注重潜在能量，我们可以从广博的数据库中，找到大量有价值的知识、图片、文字等重要信息内容。数据库技术、网络技术以及计算机硬件，是时代发展的科技结晶，它在贮存大量数据的同时，也扩大了人们采集数据的范围。经过多年的发展，数据挖掘已经在商业、金融、医疗等各个领域得到了广泛的应用。本文从数据挖掘的含义、功能出发，探究了数据挖掘的种类和内容，以及在高校招生信息化中的运用。中国论文网 /8/view-7241537.htm 　　关键词：数据挖掘；数据库技术；信息化；运用　　中图分类号：TP311 文献标识码：A 文章编号：1009-3044（2016）01-0001-02 　　数据挖掘又称为数据库中的知识发现，是指从很泛很杂且朦胧的数据提取，同时数据提取又是非常隐秘的，人们无法预知的，但是它又真实的潜藏在，有价值的信息传播过程中。　　1 数据挖掘概述　　数据挖掘是由统计学、人工智能、数据库、可视化技术等，与当代科技相融而成的，一门交叉性学科，是发现知识的重要工具。计算机硬件与数据库技术的持续增长，在一定程度上带动了，数据信息的发展，但与此同时，保存在数据库之中以及计算机磁盘里的容量信息，却在一步一步锐减。数据信息的肆意增长，渐渐蒙蔽了人们的双眼。然而，数据挖掘技术的出现，却妥善的消除了信息弊端，使人们在网络信息数据库中，找到了真正有实用价值的资源。　　2 数据挖掘的功能　　数据挖掘的具体功能主要分为以下几个方面：　　概念描述可以分为两种，一是特征性描述，二是区别性描述，概念描述的真实含义，就是对指定对象的内在心理，进行语言描述，并说明这类对象的主要特点。特征性描述的是同一种事物的共性，区别性描述的是同一类事物的差异。描述数据的存在形式，可以是多样化的、朦胧式的，它的主要功能，就是用户的数据考察。　　1）关联分析　　数据之间的关联性，是数据库中存在的一种十分重要的，容易被人挖掘的信息资源。如果多个变量的取值之间，存在着强烈的逻辑性，那么它就被称为关联。关联通常会被分为三种，一是简单关联、二是时序关联、三是因果关联。关联分析是从大量的数据中，集结而来的微妙关系，也分为前后关系和因果关系，相互牵连。　　2）分类与预测　　分类数据的探究和摸索，是一项任重而道远的任务。分类的原因是受系统中的，分类函数和分类模型的影响。这种模型可以把数据资料库中的，数据项目传送到定类数据中，从而构成分类器，但要完成传输任务，系统这时就需要有一个模型样本数据集，作为传输工具。　　预测是系统利用历史数据而设置的一个初步模型，再运用新的数据作为输入值，这样就可以得出未来的数据倾向值，或是结合评估和样本模型，才能获取具体的属性值或是值数的范围。　　3）聚类　　聚类的含义是指，同一种相似类型的数据，相互之间存在的差异性，依照数据的不同特点，通常意义上，要将他们归纳为不同的数据种类。其目的是在距离上缩小，同一种类型的数据差异，同时在另一个角度，要拉大不同数据种类之间的距离。聚类与分类的区别主要体现在：分类需要提前给数据一个定义类别和模型样本；而聚类分析就只有一个方向，那就是数据根源，不需要提前预定数据类别，也不需要模型样本，所有的传输记录，都会根据事物的相似性，汇集成同类数据。　　4）偏差分析　　偏差分析又名为比较分析，是对差异性和特殊个体的描述，揭示了个体区别于其他事物的反常现象，其根本思想就是，寻找到观测结果与参照值之间的具体差别性。偏差包含了分类中的反常事物、不符合事实的特例以及观测结果，甚至于对模型预测的差异性、数量值随时间的变化等。　　3 数据挖掘处理过程　　数据挖掘的过程是多样化的，需要细心分析，它大致可以分为问题定义、数据收集和预处理、数据挖掘，以及结果表达和解释等。　　1）问题定义　　数据挖掘的主要任务，就是要从大量信息数据库中，寻找到可使用的信息资源。知识应是数据挖掘的一个重要步骤，在问题定义阶段中，数据挖掘人员一定要，与相关知识的专家联合，确定挖掘目标，以及对数据统计的具体要求，最后通过不同的计算法则，选出最适合的计算方式。　　2）数据准备　　数据准备可以简单地分为三个步骤，一是数据选取、二是数据预处理、三是数据变换。数据选取的含义是，根据已有信息数据，从最初的原始数据库中，查找出适合数据挖掘的信息资源。数据预处理是对，数据信息贮存的再分类，这其中包含了数据检查的整体性，数据信息的统一性，以及数据内部结构，消除杂音、弥补数据遗失、删除过期数据等程序。数据变换的主要用途是，在一定范围内，消除和减少数据维数，其方法就是，从数据的最初特点中，寻找到可以使用的数据特点，使数据在挖掘过程中，最大额度的减少特征