数据挖掘及其在高校管理中应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘及其在高校管理中应用

数据挖掘及其在高校管理中应用   摘 要:伴随日常教学管理的向前发展,各高校网络系统积累了大量的关于学生、教师、教学活动等方面的数据,这些数据存在很大的利用价值,可为高校进一步发展提供决策依据。然而,各高校网络系统当中的数据多用于进行简单的信息查询或是报表统计,而未对数据的深层信息进行挖掘,导致数据利用不充分,未发挥系统数据应有的作用。文章简单阐述了数据挖掘的基本概念及其方法,并就数据挖掘在高校管理中的应用展开了讨论。   关键词:数据挖掘;高校管理;应用   在实际工作当中,各行业数据库系统只是提供了部分极其简单的数据管理和处理功能。而随着社会的发展,人们渐渐意识到数据的重要性和作用,对于数据分析及处理的要求也越来越高。面对数据库中的海量数据,人们急需一种系统而科学的数据处理及分析技术,以深入开发并利用这些数据,为决策服务提供数据支持。   1 数据挖掘概述   1.1 数据挖掘的基本概念   数据挖掘就是指在大量的数据或是数据库当中将人们所需要或感兴趣的数据进行提取和分析的过程[ 1 ]。由数据挖掘的概念可知,数据挖掘是一个在大量未加工的数据系统当中发现有价值数据的过程。这些数据存在潜在的价值,可为决策服务提供信息支持,这类数据的存在形式包括概念、规则、规律、模式等。   数据挖掘是一门交叉性的综合学科,其集机器学习、统计分析及数据库技术于一体,将数据应用从简单的查询功能提升至数据当中挖掘有价值的信息,以为决策提供数据支持[2]。现数据挖掘已广泛应用于各领域,包括医药、农业、电信、金融、互联网、市场营销等,且在各领域发挥着非常重要的作用。   1.2 数据挖掘的方法   数据挖掘是将数据库技术与人工智能相互结合而产生的一种新型数据技术,数据挖掘的方法多数来源于机器,通过不断改进,很多机器学习、人工智能的常规技术都可成为数据挖掘的方法[ 3 ]。总体而言,数据挖掘的方法主要包括以下几类:   第一,粗糙集法。粗糙集理论是将集合论进行扩展而形成的,其主要用于对不确定性问题进行研究,包括各种研究未完全、信息描述不完整等数据,是近些年来逐步兴起的一种问题解决理论。利用粗糙集法可在数据先验知识不足的情况下,基于对数据分类能力进行考察而实现各种模糊或是具强不确定性的分析和处理。粗糙集法操作简单,现有很多数据挖掘工具都是在粗糙集法的基础上而建立的。   第二,聚类法。聚类法是指将所要分析的对象分成多个群体,每个群体当中的对象存在很大的相似性,而不同的群体之间其相似性则相对较小。通常来说,一个群体就一个类别,但相比于分类,聚类法有所不同。聚类的结果其所针对的数据是当前要进行处理的数据,在聚类之前是不知道数据的类目结构及对象的类别的。聚类是数据挖掘的第一个步骤,其将数据以群体方式进行了分类,以方便后期进行进一步分析。   第三,决策树法。决策树法主要用于解决分类问题。决策树法分为两个阶段:构造树和修剪树。构造树是指利用训练数据形成测试函数,依照取值的不同来建立分支,然后在每个分支下再建立下层分支,通过这样重复的不断建立从而形成一棵决策树。修剪树是指在构造树之后对其进行修剪,将决策树转化为一定的规则,并利用所得到的规则将新事例进行分类。相比于其他分类法,利用决策树法进行分类速度较快、规则形成简单容易且易于转化为数据库查询语言,特别是对维数高的问题进行分类可取得良好的结果。   第四,人工神经网络法。人工神经网络法是一种软计算方法,神经网络可以管理或是非管理模式进行学习。若采取管理模式,则需对已有的示例可能会产生的结果进行预测,比较预测结果及目标答案并通过错误实现学习的目标。神经网络的管理模式主要用于解决预测、分类及时间序列等问题。非管理模式的神经网络法多用于解决数据描述类问题,而不适应于结果预测类问题。神经网络在采取非管理模式时需建立其类描述、合法性验证及操作,其无关于数据模式。人工神经网络法需较长时间,其行为类似黑盒,因此其可能无法满足商业分析的相关要求。   第五,进化计算法。进化计算法主要是指对生物进化模式进行模仿的计算方法的总称,有遗传算法、遗传编程、进化策略、进化规划等方法。进化计算法是基于适应度函数约束而进行的智能化搜索,在不断的搜索当中逐步接近目标,从而将目标数据提取出来。进化计算法的操作具杂交性和变异性,其搜索范围非常广,因此利用进化计算法所得到的结果可以说是所有结果当中的最优解,同时因其为框架式结构,所以利用此方法一般只需要选择适应度函数并完成相关编码,其余操作则可由系统自动完成。   2 数据挖掘在高校管理中的应用   2.1 挖掘学生特征   根据系统当中现有的学生信息,如基本信息、学习历史、学习成绩、学习偏好及知识结构等,对学生的特征进行挖掘,以帮助学生及时改善学习行为。通过比较学生

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档