- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用主成分分析模型构造中学考试综合评价指数
[摘要] 在中学考试的综合评价中,使用较多的指标进行描述使分析复杂化,难以对众多指标的影响作出正确的判断,需要少量几个“综合评价指标”。通过简单加权的合成方法,难以得到科学的结果。主成分分析是一种多元统计方法,可以将众多指标简化浓缩为少量几个甚至一个综合评价指标,使简化的指标既能基本包括全部指标具有的信息,又使指标之间相互无关,较好地解决了这一课题。
[关键词] 考试评价;主成分分析;数学模型;计算步骤,指数构造方法
一、问题的提出
在中学考试评价中,通常使用各学科的“平均分”、“优秀率”、“及格率”和“低分率”等指标。考虑到成绩的分布状况(“优秀率”与“及格率”之间的差距偏大,可能失去部分信息量),某些地区还使用了“良好率”指标。这样,k个学科的考试评价的p项指标将多达k╳p个。在对考试进行综合的评价时,使用较多的指标进行描述不仅会增加评价的工作量,而且会因评价指标间的相关性造成评价信息重叠,相互干扰,其结果使分析复杂化,难以对众多指标的影响作出正确的判断。因此,需要少数几个甚至一个“综合评价指标”来代替众多的且相互之间具有相关关系的指标,同时又需要不失去原有指标具有的信息量,这是考试评价中具有现实意义的课题。
某些地区采用一种“降维”的方法,较成功地把k╳p维指标降为p维指标,即在使用“总分平均分”的同时,用“科平均╳╳率”取代各科的“╳╳率”(计算方法见备注1)。如何把p维指标再合成为一个“综合评价指标”?采用一些简单加权的合成方法时,由于对各指标的影响不容易作出正确的定量化的判断,及权数产生的科学性等问题,往往难以得到令人信服的科学的结果。
主成分分析是一种多元统计方法,可以将众多指标简化浓缩为少数几个甚至一个综合评价指标,使简化的指标既能基本包括全部指标具有的信息,又使指标之间相互无关。较好地解决了这一课题。
二、主成分分析的数学模型
设有n个样品,每个样品观测p个指标(变量):X1,X2,…,Xp, 得到原始数据矩阵:
用数据矩阵X的p个列向量(即p个指标向量)作线形组合(即综合指标向量)为:
上述方程组要求:
且系数αij由下列原则决定:
①、Fi与Fj(i≠j,i,j=1,…,p)p的一切线性组合(系数满足上述方程组)中方差最大的,F2是与F1不相关的X1,X2,…,Xp的一切线性组合中方差最大的,…,Fp是是与F1,F2,…,Fp-1都不相关的X1,X2,…,Xp的一切线性组合中方差最大的。
这样决定的综合变量F1,F2,…,Fp分别称为原变量的第一,第二,…,第p主成分,其中F1的方差在总方差中占的比例最大,其余主成分F2,F3,…,Fp的方差依次递减。在实际工作中挑选前几个甚至一个最大主成分F1,就能够基本包括全部指标所具有的信息,达到了将众多指标简化浓缩为少数几个甚至一个综合评价指标的目的。
三、主成分分析的计算步骤及实例
求解满足上述要求的方程组系数αij的运算,在数学上可以变为求方程组中的系数向量,即矩阵的特征值及其相应的单位特征向量的问题。
建立模型时,首先将原始数据写成矩阵,如(式1—1)。注意:原始数据矩阵X的p个指标需要有一定的联系,而且为正相关(如果为负相关,需要进行相应的转化)。
1、将原始数据标准化。
2、建立变量的相关系数矩阵:R =(rij)p╳p 不妨设R=X’X
3、求R的特征值λ1≥λ2≥…≥λp 0 及其相应的单位特征向量:
4、写出主成分:
Fi = a1iX1 + a2iX2 + … + aPiXP i = 1, …,p
5、计算第j个主成分(特征值)的方差贡献率及前几个主成分的累计方差贡献率。选取累计贡献率大于某值(如定为90%、95%、99%等)的前几个主成分。
6、对选取的主成分进行解释或分析。
主成分分析计算过程举例:
对青岛市中考的5项指标作主成分分析,原始数据如附表1:
由于“低分率”指标与其他指标之间呈显著的“负相关”,直接代入必然产生严重的干扰,故实际写入矩阵时该指标以“100% - 低分率”的形式出现。
第一步、将原始数据标准化。
第二步、建立变量的相关系数矩阵R如下:
X1 X2 X3 X4 X5 X1 1.000 0.885 0.942 0.979 0.989 X2 0.885 1.000 0.966 0.933 0.818 X3 0.942 0.966 1.000 0.983 0.889 X4 0.979 0.933 0.983 1.000 0.949 X5 0.989 0.818 0.889 0.949 1.000 表1、相关系数矩阵R
第三步、求特征值、特征向量和方差贡献率
主成分 特征根 方差贡献率 累计贡献率 1 4.7350 94.70 94.7
您可能关注的文档
- 瑶中高三年级第一次月考语文试卷.doc
- 甘仲萍PEP小学五年级英语教案设计“教学中的互联网搜索”优秀教学案例评选教案设计[1].doc
- 甘肃专升本考试计算机填空题热点考点.docx
- 甘肃教育出版社小学五年级下册信息技术教案全集1.doc
- 甘肃省一万名下基层特钢教师、文化站、农技、社保模拟测试真题五.doc
- 甘肃省兰州一中2012届高三上学期期中考试.doc
- 甘肃省初中学生毕业升学体育课程.doc
- 甘肃省天水市秦安县高中2013-2014学年高二语文上学期期末考试试题(含解析)新人教版.doc
- 甘肃省张掖市城关中学九年级语文上册第三单元同步测试北师大版.doc
- 甘肃省武威第五中学2014届九年级上学期语文期中试题(word版含答案).doc
文档评论(0)