- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于粗糙集理论的数据挖掘技术在高校学生成绩分析中的应用.pdf
第22卷第l2期 荆门职业技术学院学报 2007年l2月
V01.22 No.12 Journal of Jingmen Technical CoHege Dec.20cr7
基于粗糙集理论的数据挖掘技术
在高校学生成绩分析中的应用
胡玉荣
(荆楚理工学院计算机学院,湖北荆门 448ooo)
[摘 要】 在讨论目前高校教学中存在问题的基础上,简单介绍粗糙集理论及数据挖掘技术。以高校学生成绩为
例,提出基于粗糙集理论的数据挖掘技术在高校学生成绩分析中应用的解决方案。
[关键词】 粗糙集理论;数据挖掘;学生成绩分析
[中图分类号】 TP311 [文献标识码】 A [文章编号】 1008—4657(2007)12—0018—05
0 引言
影响学生学习成绩的因素很多,因此要进行综合分析。传统分析无非是得到均值、方差、信度、效度
和区别显著性检验等,往往还是基于教学本身。其实,还有一些教学中不易察觉的因素和教学以外的因
素影响学生学习成绩,这些都是需要进一步分析,从而得出结论,供教育管理人员做出相应的决策。这
些信息无法从传统的学生成绩分析方法获得,但可以通过从20世纪90年代中期兴起的数据挖掘技术
获得,从而找到影响学生学习成绩的真实原因,来制定相应措施,提高教育效果。
1 基于粗糙集理论的数据挖掘技术
数据挖掘就是从大量的、不完全的、有噪声的、模糊的数据中,提取隐含在其中的以前未知的并具潜
在可用的模式的过程u】。如何对复杂的、不完整数据进行分析、推理,发现数据间的关系,如何提取有
用的模式,简化信息处理,如何确定不精确、不完备知识的表达,这是数据挖掘要解决的首要和最重要任
务。
粗糙集(Rough Set)理论-2 是波兰科学家Pawlak在1982年提出的,借鉴了逻辑学和哲学中对不精
确、模糊的各种定义,针对知识库提出不精确范畴等概念,并在此基础上形成了完整的理论体系——粗
糙集理论。粗糙集理论是建立在分类机制的基础上的,它将分类理解为在特定空间上的不可分辨(等
价)关系,而不可分辨关系构成了对该空间的划分。粗糙集理论作为一种新的分析和处理不精确、不一
致、不完整信息和知识的数学工具,正好可以满足数据挖掘中数据特征的需求,因而,粗糙集理论正越来
越广泛的应用于数据挖掘领域。
数据挖掘是一种决策支持过程,是深层次的数据信息分析方法,将数据挖掘技术应用于教学非常有
益,它可以全面地分析学生成绩与各种因素之间隐藏的内在联系,比如,经过对学生成绩相关数据库系
统的分析,数据挖掘工具可以问答诸如“哪些因素对学生的学习成绩可能有影响”等类似的问题,这是
传统方法无法达到的。通过数据挖掘分析,其结果可能给教学带来一定的收获。
[收稿日期】2007—05一l6
[基金项目】湖北省教育厅科研项目(项目编号:B200767002);荆楚理工学院科研项目(项目编号:ZR200601)。
[作者简介】胡玉荣(1970一),女,湖北钟祥人,荆楚理工学院高级讲师,硕士。研究方向:数据挖掘。E—mail:yu—
mnghuS01@sina.COITI。
18
2 解决方案
这里,笔者提出采用数据挖掘中的分类算法,将大量的数据转化为分类规则,从而更好地分析这些
数据。图1为分类挖掘实施流程图,步骤说明如下。
第一步:确定挖掘对象、目标。清晰地定义出问题,认清数据挖掘的目的是
I确定挖掘对象及目标 数据挖掘的重要一步。虽然挖掘的最后结果不可预测,但要探索的问题应是有
预见的。
I 数据采集 第二步:数据采集。这是一个工作量较大、占据时间较多的阶段。教师需
要在以往的教学实践中,以各种途径收集数据信息。
数据预处理 第三步:数据预处理。将教师收集到的不同的数据信息集成并转换为一个
分析数据模型,这一数据模型是针对算法而准备的,不同的算法可能需要不同
数据分类挖掘
的分析数据模型。
文档评论(0)