主成分解析Word文档.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分解析Word文档

?为了有效的地进行这种评价,我们希望寻找尽量少得m个综合特征值,这m(mp)个综合特征值应包含p个变量的有关信息,并以这m个综合特征值对此同进行综合评价。显然,m越小,与之进行综合评价就越方便。称这样的方法为主成分分析(Principal component Analysis,简称为PCA)。   8.3.1 基本原理??????首先,我们以包含两个变量的教学系统___两门课程的学习成绩为例。  HYPERLINK javascript:show(text1_1); 内容扩展  ?????? ??????设课程x1与x2时两门有一定相关性的课程,如:数学与物理。N名学生的学习成绩为: ?????? ?????? ??????(xi1,xi2) i=1~n ?????? ?????? ???? ??????(8—22) ?????? 将这n组数据描在x1-x2平面上,则有图8.5(p=2的主成分)所示的图形。 ?????? 由于x1,x2是两门相关性的课程,学习成绩在x1-x2平面上分布集中在椭圆形的范围内(图a)。该椭圆是一种狭长形的椭圆,数据在长轴的方向上变化较大。从图可知,为了评价学生的成绩,x1,x2都是必需的,不能偏废某一个。 ?????? 由于x1,x2集中在一个狭长的范围内,我们可对这些数据作某种变化,将它变换到z1~z2平面上,则有图b。从图b可知,在z1~z2坐标中,z1,z2的相关性较小,且数据在Z1轴上的分散较大,在Z2轴上的分散较小。由于进行了这宗变幻,由Z1就能对学生的成绩进行综合评价,且Z1包含有X1,X2给出的信息。这样,经过一定的变换后,我们将以两个变量X1,X2评价学生成绩的系统,变换为主要由一个变量Z1对学生的成绩进行评价。此时,我们称Z1第一主成分。 ?????? 显然,若X1,X2不是相关的,X1,X2在 X1-X2 平面上的分布将是一种随机的均匀分布的图形(图c)。这些数据经Z变换后,在Z平面上的分布仍是一种均匀的分布,不可能找到上述的主成分。 ??????同样,对于P门课程的成绩,我们进行分析。 HYPERLINK javascript:show(text1_2); 内容扩展 ??????可用P维空间中的矢量: ????????????xi =(xi1,xi2,xip) i=1—n ??????????????????(8-23) ??????来表示。 ??????式中,n为学生数,p为课程门数。若p门课程具有一定的相关性,通过某种变换,我们可以找到一种新的m维综合变量空间,且有mp。在这个空间中,变量间的相关性较小。使用这种新的变量,可以做到,以较小的变量,对学生的成绩进行综合评价。 ??????主成分分析是一种将彼此相关的p个变量(特性)x1,x2,…xp所具有的信息,以满足以下两种条件: ??????(1)Zk 与Zk'不相关(k≠k,k、k=1、2…m)。 ??????(2)z1,z2,…zm的分散逐次减小,即 ??????z1的分散z2的分散…zm的分散的m个综合特征值z1,z2,…zm(mp)所表示的统计分析方法。在m个特征值中,我们称Zi(i=1—m)为第i主成分。 ?????? 主成分分析是一种进行信息压缩的方法。通过这种方法,可以将原来相关的若干变量,变换成不相关的变量。 HYPERLINK /zsb/zjx/zjx12/zjx128/zjx12803/zjx128030.htm \l top#top 返上 8.3.2 主成分分析的方法?????? HYPERLINK javascript:show(text2_6);  详细分析  ??????设p维空间的向量为:( 8-24) ??????即总体中的每一个样本有P个指标,其平均为 ,方差为u 0。我们的任务是寻找m个综合指标Y1,Y2…Ym(m p),要求这m个综合指标能充分反映原来P 个指标的信息,而且彼此间应该式不相关的。 ??????设m个指标与P个指标间具有以下现行变换关系: ?????? ???????????????????? (8-25) ?????? 式中,,满足 ?????? ????? ????? ????? ? ????( k=1~m) ???? ??称为变换系数。在决定 时,应满足以下要求: ???? ??(1)Yi与yj(i j, i,j=1,2,…q)相互独立; ???? ??(2)Y1的方差〉Y2的方差Ym的方差。 ???? ??分别称Y1,Y1,…Ym为第一主成分,第二主成分,…第m主成分。 ????? 基于这样的设定和要求,对于n个样本 ?? ???? 求主成分的计算过程如下: ? ?? (1)对样本数据的标准化?

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档