- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析数据挖掘在高职校教学与管理中应用研究
浅析数据挖掘在高职校教学与管理中应用研究
摘要:当今社会是个信息技术飞快发展的网络信息时代,学校传统的教学与管理模式已经不能很好的适应现代化教育的发展。如何从庞大的教学管理数据中及时准确的挖掘出隐藏在数据中对教学与管理有价值的信息,从而更好的为学校教学和管理服务,就应运而生了一项能够对大量数据信息进行分析挖掘的数据挖掘技术。该文就从数据挖掘的概念出发,简要的阐述数据挖掘技术在教学与管理中的应用。
关键词:数据挖掘;学校教学;教学管理;应用
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)26-5805-03
随着信息技术的不断发展,数据量的不断增大,面对庞大的数据信息的合理使用,应运而生了数据挖掘技术。目前数据挖掘技术已经在商业、金融、医学等领域得到广泛的应用,但是在学校教学管理中还未得到广泛的关注。然而学校教学管理本来就积累了海量的数据,这些数据形成了一个信息容量巨大的数据库。如何有效的对数据进行挖掘分析,发现隐藏的有用信息资源来更好的指导教学与管理,辅助学校管理决策,更好的服务于教学,是目前重要的研究课题。该文就从数据挖掘的概念出发,简述数据挖掘在高职校教学中的应用。
1 数据挖掘与数据挖掘技术的概念
1.1 数据挖掘
数据挖掘的概念分为广义和狭义两种。
数据挖掘(Data Mining):广义的数据挖掘又称数据库中的知识发现(Knowledge Discovery in Database),简称知识发现(KDD)。它是从大量的、不完整的、有噪声的、模糊的和随机的实际数据中,经过提取、转换、分析等处理技术,提取隐含在其中的、人们事先不知道的、但又是可信的、潜在的和有价值的信息和知识,帮助决策者分析历史数据以及当前现有的数据,从中发现隐含的关系或模式,进而预测出未来可能发生的行为的过程。
狭义的数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据之间关系的过程,是知识发现过程中的一个关键步骤。
简单的说数据挖掘就是从大量的数据中“提取”或者“挖掘”知识的过程。
1.2 数据挖掘技术
数据挖掘技术实际上是???们长期以来对数据库技术进行开发研究而总结出的结果,其中数据挖掘与数据仓库技术的发展有着密切的关系。大多数情况下,数据挖掘首先是要把数据从数据仓库中取出放到数据挖掘库中,然后数据仓库对数据进行清理,发现解决数据不一致等问题。但是由于数据挖掘的所发现的知识有所不同,因此所利用的技术也有所不同。
2 数据挖掘分析方法与分析步骤
数据挖掘利用的技术越多,那么得出的结论的精确度就越高。因为,对于某一种技术不适用的问题,其他方式方法可能有用,这主要看问题的类型以及数据的类型和规模。下面简要介绍几种能适用于高职校教学管理工作的数据挖掘技术。
1)关联分析:关联规则挖掘是数据挖掘的一个重要研究方法,也是教学中最常用的一种方法。关联规则描述的是从大量的数据集中发现有用的依赖性或关联性的知识。该方法起初是为了分析市场购物篮所提出的,目的是为了发现顾客的购买模式。目前关联规则在其它领域也得到广泛的应用。
2)分类与预测:分类是根据某个分类器将数据库中的数据对象一一划分到给定的几个类别中的某一个中。操作步骤为:先构造分类器,后利用所获得的分类器对数据进行分类。分类是一种事先确定了类别与类别个数的有指导的学习过程。分类模型可用于预测。预测是利用学习所获得的模型对未知类别的数据对象进行类别预测。例如学生成绩数据库中,根据学生各科考试成绩,将学生的成绩分类为:优秀、良好、一般、差四个等级。对每个类别标记之后就是对数据进行分析,对每个等级挖掘分类规则也就是对每个数据做出精确的描述,如“成绩优秀的学生各门考试科目的成绩都不低于90分”,然后根据分类规则对数据库中标记的其他相同属性的数据进行分类。
3)聚类:与分类是事先确定了分类的类别相反的聚类只是将数据全部输入数据库中,然后对数据进行分析。根据一定的法则将数据合理的划分多个不同组,使得同一个组内的数据具有较高的相似度,不同组之间的数据基本无相似之处。聚类是在不知道类别和类别个数情况下的一种无指导学习过程,这点恰好和分类相反,正好说明聚类与分类是一个互逆的过程。
4)决策树:利用概率论的原理,以树的成长过程将事例根据不同类别进行分类。它可以对数据进行分析也可以预测,优点在于理解性强、直观、分类速度快,缺点是对于庞大的且复杂的数据时,分支数多,管理难度大。
5) 遗传算法:是由美国密西根大学D.J.Holland 教授和他的同事们根据自然界优胜劣汰、适者生存的自然进化过程而研究出的结合自然选择原理和遗传机理相结合的随机搜索算法。遗传算法采用的是概率寻优的方法
文档评论(0)