- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于主成分分析的学生综合成绩评定.doc
基于主成分分析的学生综合成绩评定
摘 要 平均分排名法评定学生不科学,有失公平。本文在考虑试卷难度,课程性质情况下进行无量纲化处理,小样本情况下引入难度系数,采用主成分分析法进行综合评定。
关键词 平均分 无量纲化 难度系数 主成分
学生综合成绩评定是对学生学习情况的客观反应,科学、公平的评价学生综合成绩是营造良好的学习氛围的必然要求,同时对学校评定奖学金,评优评先具有指导意义。但是大多数学校在评定中采用简单的总分或平均分排名法具有严重的不科学性,不合理性,不能真正反应学生的真实水平。特别是对于同一年级,不同专业,不同课程,不同的考卷,不同的阅卷老师及不同的评卷标准等。本文在克服上述问题的情况下采用主成分分析方法建立综合评价模型。
1成绩评定面临的问题
每门课程学时的差异,如高等数学180学时,法律基础40学时,同样得90分,学习高等数学一定比学法律基础要付出的多,评价时要考虑每门课程的学分;每门课程难易程度差异,如高等数学平均分60分,最高分100,法律基础平均分80,最高分也是100,同样是100分,高数的100分比法律基础100分,更难获得,评价时要考虑试卷难易程度,同时克服试卷的难易程度也就克服了专业的不同,考试科目的不同;考查科目的优、良、及格,带有更多的教师感情色彩及主观意志。不能简单的给与95、85、60来加入综合成绩评定,评价时要考虑考查科目与考试科目区别。
一门全院性的公共课,参考人数多,样本大,在大样本的情况下,考试成绩的分布趋近于正态分布,而主成分分析法的一个前提条件是各指标数据的分布应服从正态分布,同时主成分分析进行多指标评价时,常用到标准分来进行无量纲化处理。因此有必要对标准化考试情况下的数据无量纲化,同时数据的无量纲化处理,也消除了因课程性质、试卷难度、不同科目等差异造成的原始成绩不可比较的问题。针对此问题,对考试成绩做如下无量纲化处理。
2标准化考试情况下的数据无量纲化
不同科目间,由于课程性质、课程难度、试卷难度和评分标准的不同,各科分数是具有不同“含金量”,即不同量纲,必须要进行无量纲处理。利用Z标准分变换的计算公式为:
式中,zi为标准分,xi为学生该课程的成绩,n为考生数,xi为课程成绩的平均分,?%li为该课程的全部考生的成绩标准差。其中,,计算后各指标数据的平均值为0,方差为1,各变量间有了统一的量纲,消除了由于课程性质不同、试卷难易程度不同和成绩分布不一致带来的问题,且各指标在变化前后的相关程度不变。
3不同课程的数据无量钢化(考虑难度系数)
不同专业的不同课程难易程度不一样,学习效果也不一样,为了规避课程的难易程度,将考试成绩无量纲化,首先引入难度系数。表明平均分越高难度系数越小,试卷越简单,反之难度系数越大,试卷就越难。
不同的专业课 ,学习人数差异大,尤其是学生人数较少的专业,由于样本少,通常不符合标准正态分布,倘若成绩出现两极分化,会使得标准差很大,这时若标准化,数据失真就更大。我们必须考虑难度系数,把成绩标准化
即:=*,然后再利用标准正态的方式无量纲化。
建立相关系数矩阵,求特征值、特征向量和载荷矩阵
(1)在标准化数据矩阵X*=(X1*,X2*,…,Xp*)的基础上,利用公式R=(X*)X*计算原始指标的相关系数矩阵,其中是指标X1*与Xj*之间的相关系数,则
。根据公式|R?%djE|=0,求出前P个特征值?%d1?%d2…?%dp≥0。
(2)根据公式|R?%djE|xi=0,求出与特征值?%dj相对应的单位正交特征向量Uj=(u1j,u2j,…,upj)。
(3)计算主成分载荷矩阵。根据相关系数矩阵R的特征值?%dj和特征向量u1,…,up,则初等载荷矩阵为?%l=[,,…,]。
4选取主成分
主成分分析将原来有一定关系的多个原始指标转换成几个互不相关的主成分的方法,其目的就是降低原始指标的维度,所以一般会选m(mp)个主成分。其中方差贡献率为,累计贡献率
在选取主成分过程中,应参考以下原则:
(1)通常取m使得累计方差贡献率达到较高比例(80%)。
(2)选取特征根大于1的主成分
(3)特征根散点图:将特征值(由大到小)与对应特征根绘制一条曲线,观察是否有明显“突降点”若有则此点前的特征根个数可取M。
按照以上原则选取的主成分个数不仅能使信息损失较少,而且达到减少变量的目的。
5综合评价分析
经过计算选取的主成分互不相关且相互独立,利用原始指标无量纲化后的数据计算各主成分得分即:
Fi=UiX*=u1iX1*+u2iX2*+…+upiXp*
以各主成分的方差贡献率作为权系数,利用各主成分得分
文档评论(0)