DPS数据处理系统V2(C18-多因子分析).docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
·page660· STYLEREF 标题1 第18章 多因子分析 STYLEREF 标题2 参 考 文 献 ·page659· 第18章 多因子分析 多因子分析是一种将多变量(指标)样本在结构上进行简化的有效方法。通过分析找到一个包含最佳变量的子集合,使其所包含的变量能反映总体的结构。这种简化结构的处理对研究多因素之间的规律和构造模型等有重要的作用。DPS系统提供的关于多因素分析的主要功能模块包括主成分分析、因子分析、对应分析及典型相关分析等5种分析方法。 18.1 主成分分析 18.1.1 基本原理 主成分概念由Karl Pearson于1901年提出,由Hottelling于1933年推广到随机变量,主成分分析是多元统计分析中的重要统计方法,是用较少的综合指标来代替原来较多的指标。 多元分析中的随机变量,是对同一个体进行测量结果。从多个实测变量提取较少、互不相关综合指标,反映总体信息,这种综合指标就称为主成分。主成分分析可在不丢掉主要信息前提下,避开变量间共线性问题,便于继续用其他多元统计方法进行分析。 设两个变量n个样品,在二维空间分布大致为一椭圆。作坐标旋转,使新坐标系为椭圆长、短轴方向,坐标旋转公式为 对于标准化后的数据,旋转角度为45?。如有11个样本的两个变量数据,实施标准化后显示如图18-1中的小圆圈。 图18-1 两变量主成分分析??坐标旋转 从图18-1可以看出,各点坐标呈正相关。主成分分析,数据点顺时针旋转45?后处于星号点位置。这时数据点大部分在横坐标方向,变异(方差)集中在横轴,为第一主成分;纵轴方向变异(方差)较小,为第二主成分。且相关为零。 一般地,设变量xi的样本均数和样本样本差分别为和si,i=1,2,…,m。变量标准化公式为 对标准化后的变量zi寻求主成分。第一主成分C1是z1,z2,…,zm的线性组合,即 C1要尽可能多地反映原m个变量的信息,在的条件下,C1的方差Var(C1)要尽可能大。如把 a11,a12,…,a1m视为向量,代表m维空间的一个方向,相当于个体z1,z2,…,zm在此方向的投影最为分散。 若第一主成分不足以代表原m个向量,则再考虑第二主成分C2。为有效地代表原变量的信息,C1中已有的信息不再在C2中出现,C2与C1协方差为0。这相当于在与前一个向量垂直的所有方向中,寻找一个方向,使所有个体在其上的投影最分散。类似地,考虑第三主成分,即C1、C2中已有的信息不再在C3中出现。这相当于在与前两个向量垂直的所有方向中,寻找一个方向,使所有个体在其上的投影最分散,即 Cov(C1,C3)=0,Cov(C2,C3)=0 这样,直至找到最多m个主成分。设相关系数矩阵的特征根,按从大到小排列顺序为λ1≥λ2≥…≥λm≥0。可以证明,各主成分对应的系数ai1,ai2,…,aim就是相关系数矩阵的特征向量,特征根λi就是第i个主成分的方差,所有主成分方差之和等于特征根之和,即 。 每个特征根所占总方差的比例,称为特征根的贡献。通常取主成分的个数为包含80%以上信息的变量,即特征根的累积贡献率≥80%。 18.1.2 DPS平台的操作示例 在编辑状态下输入编辑数据,每一行为一个样本,每一列为一个变量,编辑好数据后将待分析的所有数据定义成数据矩阵块。 例如,选取x1为城镇单位在岗职工平均工资(元),x2为各市固定资产投资(万元),x3为各市进口总额(万美元),x4为社会消费品零售总额(万元),x5为各市工业增加值(亿元),x6为财政收入(亿元)。原始数据编辑和定义如图18-2。 A B C D E F G H I 1 代码 地区 X1 X2 X3 X4 X5 X6 2 1 合肥 16369 66047 198.4600 3 2 淮北 13379 566257 4744 456100 76.9600 202637 4 3 毫州 9707 397183 1303 887034 18.8800 105948 5 4 宿州 10572 414932 1753 751984 27.6700 128261 6 5 蚌埠 12284 876667 18269 60.0900 332700 7 6 阜阳 9738 604935 5822 30.5400 222799 8 7 淮南 16970 778830 2438 630014 76.6400 272203 9 8 滁州 10006 617436 13543 866013 58.5900 222794 10 9 六安 10217 636760 9967 996912 34.5500 161025 11 10 马鞍山 20946 16406 526527 150.1500 426937 12 11 巢湖 11469 720

文档评论(0)

139****4073 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档