《数据挖掘在学科建设中的应用研究.docVIP

《数据挖掘在学科建设中的应用研究.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数据挖掘在学科建设中的应用研究

数据挖掘在学科建设中的应用研究 摘要:随着高校教学改革进程的加快,校园信息的积累越来越丰富,本文结合教学管理具体要求,通过设计学院某门课程的在线答疑建立的一个“随访信息库”,对在线答疑学生进行跟踪访问,记录在线答疑的数据,然后通过设计合适教学管理决策需求的数据仓库模型设计和数据处理方法,对“随访信息库”进行数据挖掘,建立了完备、正确、无冗余的教学管理系统数据仓库模型——一个有价值和指导意义的“学科建设指导库”。教师通过查询“学科建设指导库”中的信息资料,可以了解某门课中某个问题的解决方式、解决方法或解决方案,并结合教师自己的教学经验,形成解决问题的切实方案,最终达到便于教学经验的总结和提高教学质量的目的,对以后的教学改革方案的实施有重要的指导意义,为后期进行决策分析提供有效的支持和依据,从理论和实践上提供一套行之有效的方法,为高校全面进行数据仓库建设、数据挖掘研究与开发提供参考。 关键词:数据挖掘; 教改; 教学改革; 数据仓库模型; 数据仓库; 教学管理; 学科建设 中图分类号:tp 312.1 文献标识码:a 文章编号:1006-3315(2012)09-125-002 一、引言 数据挖掘技术作为一个多学科交叉的新兴学科,在研究领域等得到了越来越多的应用,尤其在需要进行信息分析的领域得到了十分广泛的应用。随着科学技术的飞速发展,如何提高高等学校教学质量,以适应新形式发展已成为一个刻不容缓的问题,而提高教学质量,改善教学环境则是改善高等教学的关键。高校教学管理中每天都会有海量数据产生,面对如此海量的数据,目前的教学管理系统只是做一些查询、更新、统计、打印报表等操作,并没有完全发挥信息技术的潜能,即没有从大量数据中挖掘所隐含的规律,从而应用这些规律去指导教师的日常工作。因此,如何利用数据挖掘技术从这些数据信息中发现有益的知识,利用信息化手段来为教师进行决策支持服务,提高教学质量以适应新形势发展,不但可以提高教师的教学水平,还可以带来更多的好处。 二、数据挖掘的相关知识 1.数据仓库 数据库系统作为数据管理手段,主要用于事物处理。在目前的计算机处理能力上,直接使用事务处理环境来支持决策是行不通的。近几年,随着数据库技术的应用和发展,人们尝试对数据库中的数据进行再加工,形成一个综合的、面向分析的环境,以更好地支持决策分析,数据仓库(data warehouse简称dw)正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。数据仓库弥补了原有数据库的缺点,将原来以单一数据库为中心的数据环境发展为一种新环境:体系化环境。数据库要建立在一个较全面和完善的信息应用基础上,用于支持高层决策分析。 2.数据挖掘的概念 数据挖掘[1-2]是指从数据库中提取出隐含的人们事先未知的、潜在的有用信息和知识,所提取的知识可以表示为概念规则、规律、模式等形式,它具备有效性、新颖性、潜在有用性及最终可理解性,即发现的知识可接受、可理解、可运用,最好能用自然语言表达发现的结果。处理的原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形、图象数据;甚至是分布在网络上的web数据和异构型数据。获取的知识可用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一个介于统计学、模式识别、人工智能、机器学习、数据库技术以及高性能并行计算等领域的交叉新学科。我国学者在这个领域也已开展了很多研究,主要来自计算机科学及相关领域。 3.数据挖掘的过程[4] 数据挖掘使用一定的算法,从实际应用数据中挖掘出未知、有价值的模式或规律等知识,整个过程由数据预处理、数据挖掘、模式评估、巩固知识和运用知识等步骤组成。 3.1数据预处理。数据挖掘的处理对象是数据,这些数据一般存储在数据库系统中,是长期积累的结果。但是往往不太适合直接对这些数据进行知识挖掘。需要先清除数据噪声和与挖掘主题明显无关的数据,其次将来自多数据源中的相关数据源组合并,最后将数据转换为易于进行数据挖掘的数据存储形式,这就是数据预处理。数据预处理是数据在进入数据仓库系统之前的处理过程,在这个过程中,需要将来自关系数据库、实时数据库或者文件系统等多个外部数据源的数据进行有效的抽取、清理、转化和综合,检查数据的完整性、一致性等质量指标,对其中的噪音数据、空值等进行处理,最后存入数据仓库。数据预处理是数据挖掘的第一步,它是整个过程中很重要的一步,数据预处理是否合适将影响到数据挖掘的效率、准确率以及最终模式的有效性。 3.2数据挖掘。数据挖掘就是根据数据挖掘的目标,选取相应的算法及参数,分析准备好的数据,产生一个特定的模式或数据集,从而得到可能形成知识的模式模型。 学院教学管理数据主要存储在关系型数据库中,大量的数据和数据模型

文档评论(0)

wu12youli + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档