- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于聚类算法学生成绩评价与管理机制研究
基于聚类算法学生成绩评价与管理机制研究 摘 要:学生成绩评价对教学管理具有监督性和指导性的重要意义,然而基于绝对分数来评价分析的传统方法存在一定的缺陷,不能充分反映学生成绩中蕴涵的信息,使学生成绩评价对教学管理的影响受限。针对这一问题,本文采用k-means聚类算法研究学生成绩,并通过实证分析,验证了隐藏在成绩数据中的内在信息对评价学生成绩的重要性,从而为教学管理提供了有利的依据。 关键词:学生成绩评价;教学管理;聚类算法;k-means 中图分类号:G434 文献标志码:A 文章编号:1673-8454(2014)13-0075-04 一、引言 在学校教育中,考试与教学不可分割,考试成绩扮演着检验学生学习情况和状态的重要角色。因此,成绩评价对于检测和监控教育质量、引导教师的教学行为,督促学生积极努力地学习是非常有必要的。现在,学校里拥有各种系统和各类数据库,积累了大量的学生成绩数据,但是由于工作人员缺乏相关挖掘知识和技术,只能通过Excel工具的简单统计获得少量信息,隐藏在这些大量数据中的信息不能得到应用。因此,如何利用学生前期的考试成绩数据进行统计分析对提高学生的知识水平有着至关重要的意义。面对这一挑战,数据挖掘技术应运而生,并逐渐显示出了强大的生命力,[1]作为数据挖掘的重要算法,k-means算法是一种硬聚类方法,即在n维的欧几里得空间把n个样本数据分成k类。[2]由于k-means聚类算法对噪声和孤立点敏感以及对处理大数据集非常有效的特点,[3]本文将k-means算法应用于成绩分析,从而全面地分析学生考试结果。 本文所引用的文献一阐述了成绩管理的作用、现状以及现有成绩管理的不足,并说明了决策树算法及粗糙集理论在成绩管理中的作用;文献二介绍了k-means聚类算法,并在此基础上提出了一种改进的遗传k-means聚类算法;文献三在分析k-means聚类算法优缺点的基础上进行改进,并通过实验比较了改进算法与原算法的优劣;文献四介绍了典型的数据预处理技术,实现了一种基于日志请求的参考文件的启发式会话识别算法。 论文利用k-means聚类算法对学生的成绩进行评价、统计和分析,从而确定学生的学业成绩在一个群体中所处的相对位置,为提高学生的成绩做准备,为教学工作提供反馈信息,并采取针对性的补救措施,从而进一步提高学校的教学质量。 二、基于聚类算法的成绩评价方案 1.总体设计方案 本论文将按图1所示,设计总体方案。同时论文将选用所在学院的成绩数据库,成绩数据库中包括了学生所有课程的考试成绩。 第一步,数据采集,为了保证数据的完整性和准确性,首先必须做好原始数据的选择和整理工作,本文选取学院某个年级的学生在某一学期的课程成绩。 第二步,数据预处理,数据预处理是一个逐步深入、由表及里的过程,经过数据审查、数据清理、数据转换和数据验证四大步骤对数据进行预处理,解决数据冲突和数据不一致等问题,最终形成一份学生成绩表。[4] 第三步,执行聚类算法在确定挖掘任务后,通过编写k-means聚类算法在matlab程序代码,实现k-means在学生成绩分析上的处理。 第四步,聚类结果评价,对聚类结果所发现的信息进行解释和评价。采用k-means聚类算法后,在学生成绩评价中,每一个类就是一个成绩群,不同的类相应地对各个成绩群进行了划分,也相应地给出了不同成绩群的中心成绩,这些中心成绩就是学生成绩划分参考标准之一。 第五步,提出针对策略,将挖掘出来的信息提供给教学决策者,调整教学策略,进一步指导教学工作,提高学生成绩。 2.基于k-means的算法设计原理 图2给出了K-means算法研究学生成绩的流程,在整个设计流程中,存在两个关键问题,分别是成绩的表示和成绩的距离计算,对于第一个问题,论文将每个学生各科目的考试成绩看做q维向量,记作xi=(x1i,x2i,…,xqi),(i=1,2,…,n),其中xki表示学生编号为i的第k门科目的成绩,成绩采用百分制,并根据不同的科目赋予不同的权重。对于第二个问题,论文采用欧式加权距离来定义学生成绩之间的距离,将聚类组数设为P,cj(j=1,2,…,p)为聚类中心,则成绩到聚类中心的距离可以用公式表示为: xi-cj=■,(1≤j≤p)(1) 其中,q为粒子的属性组成的维数,??k为各属性的权值; 对所有学生的各科成绩进行分组聚类的K-means聚类算法的具体步骤如下: Step1:设学生成绩集为Q=(x1,x2,…xn-1,xn),其中xi=(x1i,x2i,…,xqi); Step2:随机选取每个类里的一个粒子作为初始聚类中心c1,c2,…,cP; Step3:根据公式(2)将学生成绩集Q中的对象xi(i=1,2,…
文档评论(0)