11-使用SAS进行主成分分析.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
11-使用SAS进行主成分分析

主成分概念首先由 Karl Parson在1901年引进,当时只对非随机变量来讨论的。1933年Hotelling将这个概念推广到随机变量。 在多数实际问题中,不同指标之间是有一定相关性。由于指标较多及指标间有一定的相关性,势必增加分析问题的复杂性。 主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来的指标的信息。 主成分分析是考察多个数值变量间相关性的一种多元统计方法,它是研究如何通过少数几个主成分来解释多变量的方差—协方差结构。 导出几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间不相关。 三、 主成分分析的基本原理:   主成分分析是对多个指标的观察数据降维压缩,对指标间的内部从属性作客观评价的多元分析方法。 例:对n个儿童测量其身高(x1)、体重(x2)两个指标,显然这两个指标是高度相关的,若以x1为横,以x2为纵轴,用n个对象的数据作散点图。 ????  x2           。  。         。           。      。 。 。     。   。 。 ━━┻━━━━┻━━━━┻━━━ X1 散 点 图 四、 主成分分析的方法步骤 1、标准化变换:消除不同观察指标量纲不同的影响 2、计算各标准化指标变量间的相关系数,得到相关矩阵 3、求相关矩阵的特征根并进行排序 4、求矩阵关于特征根满足正规条件的特征向量 举例: 主成分分析的目的之一是简化结构,用尽可能少的主成分Z1, , Z2,…,Z2,(mp)代替原来p个观察指标。要求这m个主成分的信息量与原来p个指标提供的信息量相差不多,且希望m个主成分有实际意义。 由p个指标求得的主成分个数还是p。且因为主成分是实际观察指标的线性组合,它们的实际意义往往在求得主成分后,还需决定保留几个主成分,并需对被保留的主成分的实际意义作出专业解释。 1、主成分的均数与方差 因为主成分:Zi= ai1y1+ai2 y2+…+aip yP (i=1,2,…,p),其中yj是已经标准化后的变量,所以yj的均数为0,从而Zi的均数也为0; 可以证明Zi方差即为相关矩阵R的特征根λi ,且λ1+ λ2+ …+ λp=p. 2、主成分的贡献率: 一个变量提供的信息量常用方差的大小来衡量,方差愈大,该变量提供的信息量愈多。p个标化变量的方差之和为k,意味着它们提供的信息之和为p。现在第i主成分的方差为λi : 即p个主成分提供的信息量等于原指标的信息量。故若保留p个主成分,则原指标的信息也将全部被保留。对于下式: 描述第p个主成分提供的信息量在总的信息量中所占的比例,被称为第p个主成分的贡献率,可见第一主成分是贡献最大的主成分。 前m个主成分的贡献率之和为下式,称为前m个主成分的累计贡献率。 3、主成分个数的确定: (1)确定主成分个数的方法之一是根据累计贡献率: 一般研究者希望用主成分代替原指标后,所丢失的信息不超过所有信息的20%,即可以用累计贡献率不低于80%为标准来确定要保留几个主成分。 (2)确定主成分个数的另一方法是根据特征根λi 的大小: p个主成分之和为p,即主成分的均数为1,有人主张保留特征根大于1的主成分。 大量实践表明,根据累计贡献率确定主成分个数,往往所取的主成分个数较多,而按λi 1确定主成分个数,又往往所取的主成分个数较少。一般可将两者结合起来,即考虑了累计贡献率,又考虑了λi 值的大小。 (四)、计算主成分得分 1、 收集数据并建立数据库 2、 对变量进行标准化处理 3、 求主成分: (1) 求相关矩阵R (2) 求R的特征根: λ1≥λ2≥….≥λP (3) 求R的关于特征根λi的满足正规条件的特征向量 ai, (ai1,ai2 ,…,aip )

文档评论(0)

yurixiang1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档