- 4
- 0
- 约3.51千字
- 约 7页
- 2017-06-12 发布于福建
- 举报
数据挖掘在高校学生成绩预警中应用探究
数据挖掘在高校学生成绩预警中应用探究 摘要:随着高校教务系统数据库中大量数据的积累,教师却难以从中获取有价值的信息。针对此现状,利用数据挖掘中的Apriori算法,挖掘出频繁项集的特点,通过Apriori算法对学生成绩进行分析处理,预设支持度与置信度找出数据库中具有联系和不同可信度的课程成绩作为关联规则,将关联规则用于学生成绩预警,对处于危险区的学生提前作出预警通知
关键词:数据挖掘;关联规则 ;Apriori算法;学生成绩;预警
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2017)04-0204-03
伴随着信息时代的飞速发展,数据大量积累,数据挖掘应运而生,并得到了广泛关注。数据挖掘技术之所以能取得极大的关注,主要是可以处理的大量数据,将这些数据转换成有用的信息和知识。随着高校的不断扩招,各校的生源量明显增多,但就特别容易出现学生层次不均、成绩参差不齐的现象。目前大部分高校教务处都是利用教务管理系统对学生的信息及成绩进行管理,但都存在没有对学生的数据进行统计和分析的问题。本文将通过导出学生的专业主干课程的成绩,并对其进行统计和分析,对部分不及格课程门数较多,即将面临毕不了业或拿不到学位证的学生提出预警,对他们的学习过程进行监督。众所周知,同一专业不同的课程之间必然存在着一定的联系,本文通过利用数据挖掘技术对学生成绩进行统计、处理和全面的分析,挖掘出学生在各个课程成绩之间存在的内在联系,找出其中的关系,全面掌握学生的学习情况,从而对这些成绩不及格门数较多的学生提出预警,在今后的学习中,辅导员可根据分析结果加强对这些学生的学习过程的监督和管理,提升学生的及格率,更进一步的保证学校的毕业率
1关联规则算法:Apriori算法
1.1关联规则
设[II1,I2,…Im]为项的集合,与任务相关的数据[D]是数据库事务的集合,其中每个任务T是项的集合,其中每个任务T是项的集合,使得[T?TID]为每个事务的标识符。设[A]是一个项集,事务T包含[A]当且仅当[A?T]。关联规则形如[如A?B的蕴涵式],其中[A?I,B?I],并且满足[A?B=?]。规则[A?B]在事务集[D]中成立,具有支持度[s],其中[s]是[D]中事务包含[A?B](即集合[A和B]的并或者[A和B]二者)的百分比,即是概率[P(A?B)],规则[A?B]在事务集[D]中具有置信度,其中[c是D]中包含[A]的事务,同时也包含[B]的百分比。这是条件概率。即[supportA?B=P(A∪B)]
[confidenceA?B=P(B|A)]
同时满足最小支持度阈值([min_sup])和最小置信阈值[(min_conf)]的规则称作强规则【5】
1.2 Apriori算法
Apriori算法发现关联规则挖掘过程分解步骤:
1)通过采用迭代的方法检索出事务数据库中所有频繁项集。即找出事务?稻菘?D中所有大于等于指定最小支持度阈值的项目集
2)利用频繁项目集挖掘出满足用户需要的强关联规则。即找出支持度和置信度大于等用户给定的支持度和置信度阈值的关联规则
寻找频繁项集是挖掘关联的最核心的一步,对挖掘关联规则的总体性能起到了决定性的作用。第二步是在第一步找到的频繁项集的基础上列出所有可能的关联规则,同时,找出满足支持度和置信度要求的强关联规则即可【5】
2 Apriori算法在学生成绩分析中的应用
2.1数据预处理
以某大学2013级计算机科学与技术专业学生的专业课程成绩为例,如表1所示,从教务管理系统中导出该班级的成绩,利用关联规则算法挖掘课程和学生成绩之间关系。原始数据表分学年进行存储,其中包括本学年的班级所有学生的专业必修课和专业选修课的成绩
2.1.1课程选择
相比而言,学生公选课程范围比较广,甚至会出现一个班级只有一名学生选择同一门课程的现象,即仅有一个事务包含此项目,不满足关联规则的最小支持度的要求。根据2013级计算机专业的成绩单显示,同班学生选择同一门公选课的较少,所以公选课的成绩不作为数据来源,不对此进行分析。因此,数据库的数据包含学生的专业必修课成绩和专业选修课成绩
2.1.2成绩离散化处理
学生的原始成绩由百分制或等级制表现出来的,我们需要将这些成绩进行统一化处理,将成绩分为4个类别。百分制成绩划分如下:成绩大于或等于90分,等级为1;成绩大于等于80且小于90分,等级为2;成绩大于等于60且小于80分的等级为3;成绩小于60,成绩等级为4。根据本专业的人才培养方案,选取15门课程进行研究,分别对这些课程用字母A~O进行标识
2.2数据处理
2.2.1数据转化
根据成绩等级划分规则和课程标识码,将
您可能关注的文档
最近下载
- 市场部门市场营销专员工作手册(标准版).doc VIP
- 2025新课标义务教育数学(2022年版)课程标准试题库(含答案).docx VIP
- 电力工程专业设计工日定额-送电工程750kV部分.doc VIP
- 基于K-means和主成分分析的京张体育文化旅游带冰雪运动旅游市场研究.pdf VIP
- 电力工程设计收工日定额2012-3-28.doc VIP
- 人教版七年级下册英语全册教学设计(配2025年春新版教材).docx
- 电力工程专业设计工日定额-送电工程±500kV(直流)部分.doc VIP
- 2021春人教版九年级数学下册 第29章 全章教案.doc VIP
- 2025年湖北专升本武汉文理学院《动画概论》考试及答案.docx VIP
- 医院门诊服务优化与创新体系构建ppt课件.pptx
原创力文档

文档评论(0)