- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一项十分著名的工作是美国的统计学家斯通(Stone)在1947年关于国民经济的研究。他曾利用美国1929~1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。 在进行主成分分析后,竟以97.4%的精度,用3个新变量就取代了原17个变量。根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退趋势F3。更有意思的是,这三个变量其实都是可以直接测量的。斯通将他得到的主成分与实际测量的总收入I、总收入变化率?I以及时间t因素做相关分析,得到下表: 3. 主成分分析方法应用实例 相关系数矩阵 特征值及主成分贡献率和累计贡献率 若主成分是由原始数据计算的,则计算主成分时,代原始数据。若主成分是由标准化数据计算,则计算主成分得分时,一定要代标准化数据,否则会出现错误。 如果原始变量都本质上独立,那么降维就可能失败,这是因为很难把很多独立变量用少数综合的变量概括。 相关系数矩阵表 ? ? ? ? ? ? ? ? 1.000 ? ? ? ? ? ? ? 1.000 0.799 ? ? ? ? ? ? 1.000 0.164 0.158 ? ? ? ? ? 1.000 0.170 0.181 0.071 ? ? ? ? 1.000 0.165 0.158 0.999 0.788 ? ? ? 1.000 0.921 0.094 0.217 0.928 0.937 ? ? 1.000 0.841 0.737 0.167 0.162 0.753 0.910 ? 1.000 -0.017 -0.157 -0.150 -0.274 -0.566 -0.158 -0.016 1.000 -0.370 0.619 0.657 0.474 0.074 0.607 0.481 0.689 x1 x2 x3 x4 x5 x6 x7 x8 x9 x9 x8 x7 x6 x5 x4 x3 x2 x1 特征值及主成分贡献率表 56.029 75.428 86.504 93.285 97.061 98.967 99.840 99.996 100.00 56.029 19.399 11.076 6.781 3.778 1.907 0.873 0.156 0.004 5.043 1.746 0.997 0.610 0.339 0.172 0.079 0.014 0.0004 1 2 3 4 5 6 7 8 9 累计贡献率(%) 贡献率(%) 特征值 主成分 主成分载荷 83.05 73.20 82.19 96.63 88.26 89.97 83.19 89.90 92.16 - 0.36 - 0.08 0.00 -0.03 0.16 0.86 - 0.25 0.16 - 0.10 - 0.38 0.82 0.19 0.14 0.18 - 0.36 - 0.80 0.17 0.22 0.75 - 0.25 0.89 0.97 0.91 0.20 0.35 0.92 0.93 x1 x2 x3 x4 x5 x6 x7 x8 x9 Z3 Z2 Z1 占方差的百分数(%) 主 成 分 原变量 分析: ① 第一主成分z1与x1,x3,x4,x5,x8,x9有较大的正相关,由于这六个地理要素与流域盆地的规模有关,因此可看作是流域盆地规模的代表; ② 第二主成分z2与x2有较大的正相关,与x7有较大的负相关,而这两个地理要素是与流域切割程度有关的,因此可看作是流域侵蚀状况的代表; ③ 第三主成分z3与x6有较大的正相关,而地理要素x6是流域比较独立的特性——河系形态的表征,因此可看作是河系形态的代表。 主成分载荷 83.05 73.20 82.19 96.63 88.26 89.97 83.19 89.90 92.16 - 0.36 - 0.08 0.00 -0.03 0.16 0.86 - 0.25 0.16 - 0.10 - 0.38 0.82 0.19 0.14 0.18 - 0.36 - 0.80 0.17 0.22 0.75 - 0.25 0.89 0.97 0.91 0.20 0.35 0.92 0.93 x1 x2 x3 x4 x5 x6 x7 x8 x9 Z3 Z2 Z1 占方差的百分数(%) 主 成 分 原变量 ④ 该流域系统的9项要素可以被归纳为三类:流域盆地的规模、流域侵蚀状况、流域河系形态。选取其中相关系数绝对值最大者作为代表,则流域面积、流域盆地出口的海拔高度和分叉率可作为这三类要素的代表
文档评论(0)