- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验数理统计实验主成份分析.doc
统计软件实验报告
实验序号: 5 日期:2012年6月3日
班级 数理基础科学 姓名 李强 学号 20091050080 实验名称 主成份分析 问题背景描述:
在研究实际问题时,往往需要收集多个变量。但这样会使多个变量间存在较强的相关关系,即这些变量间存在较多的信息重复,直接利用它们进行分析,不但模型复杂,还会因为变量间存在多重共线性而引起较大的误差。为能够充分利用数据,通常希望用较少的新变量代替原来较多的旧变量,同时要求这些新变量尽可能反映原变量的信息。主成分分析正是解决这类问题的有效方法。它们能够提取信息,使变量简化降维,从而使问题更加简单直观。尤其是在社会经济统计综合评价中主成分分析是常被使用的统计分析方法。 实验目的:
运用主成份分析法对我国31个省市自治区经济发展基本情况进行综合分析和评价。
2.掌握主成分分析的思想和具体步骤。掌握SPSS实现主成分分析的具体操作,并对处理结果做出解释。 实验原理与数学模型:
实验原理:
主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合
成一组新的互相无关的综合指标来代替原来的指标。 通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1 (选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1 包含的信息越多。因此在所有的线性组合中选取的 F1 应该是方差最打的,故称 F1为第一主成分。如果第一主成分不足以代表原来 P 个指标的信息,再考虑选取F2 即选第二个线性组合,为了有效地反映原来信息,F1 已有的信息就不需要再出现再 F2 中,用数学语言表达就是要求 Cov(F1, F2)=0,则称 F2 为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
数学模型:
要求方程组满足以下条件:
每个主成分系数平方和为1即:
主成分之前互不相关 即:
主成分方差依次递减,即
实验所用软件及版本:SPSS 16.0 主要内容(要点):
对2007年全国31个省市自治区经济发展基本情况的九项指标作主成分分析分析模型(数据如表1)。这九项指标分别为:x1-GDP,x2-年末总人口,x3-财政收入,x4-固定资产投资,x5-居民消费水平,x6-居民消费价格指数,x7-商品零售价格指数,x8-职工平均工资,x9-工业总产值。
在分析过程中,提取因子的方法为“主成分”法,并以数据的“相关阵”为分析矩阵,并且提取2个因子,采用“最大方差旋转法”进行因子旋转。
实验过程记录(含:基本步骤、主要程序清单及异常情况记录等):
实验基本步骤:
1.录入数据。
2.按照analyze-Data Reduction-Factor的顺序打开。
3.选择参与因子分析的变量到Variables框。
4.单击“Discriptive”,打开Factor Analysis:Descriptives对话框,选择Statistics框中的选项Initial solution和Correlation Matrix框中Coefficients选项、Anti-image选项、KMO and Bartlett’s test of sphericity选项,最后选择Continue;
5.单击“Extraction”, 打开 Factor Analysis: Extraction对话框,选择Analyze框中的Correlation matrix选项、Display框中的Unrotated factor solution选项及Scree plot选项、Extract框中Nunber of factors选项处填入2,最后选择Continue;
6.单击”Rotation”,打开Factor Analysis: Rotation对话框,选择Method框中的Varimax选项、Display框中的Rotated solution选项及Loading plot(s), 最后选择Continue;
7.单击“Scores”,打开Factor Analysis: Scores对话框,选择Save as variables选项、Display factor score coefficient matrix选项,同时在Method框中选择Regression选项,最后选择Continue;
8.单击“Options”,打开Factor Analysis: Options对话框,选择Missing Values框中的Exclude cases pairwise选项、Coefficient Display Format框中的Sorted by size选项,最后选择Continue
文档评论(0)