- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1、主成分分析的目的是什么?
主成分分析是考虑各指标间的相互关系,利用降维的思想把多个指标转换成较少的几个相互独立的、能够解释原始变量绝大部分信息的综合指标,从而使进一步研究变得简单的一种统计方法。它的目的是希望用较少的变量去解释原始资料的大部分变异,即数据压缩,数据的解释。常被用来寻找判断事物或现象的综合指标,并对综合指标所包含的信息进行适当的解释。
2、主成分分析基本思想?
主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。同时根据实际需要从中选取几个较少的综合指标尽可能多地反映原来的指标的信息。
设p个原始变量为 ,新的变量(即主成分)为 , 主成分和原始变量之间的关系表示为?
3、在进行主成分分析时是否要对原来的p个指标进行标准化?SPSS软件是否能对数据自动进行标准化?标准化的目的是什么?
需要进行标准化,因为因素之间的数值或者数量级存在较大差距,导致较小的数被淹没,导致主成分偏差较大,所以要进行数据标准化;
进行主成分分析时SPSS可以自动进行标准化;
标准化的目的是消除变量在水平和量纲上的差异造成的影响。
求解步骤
对原来的p个指标进行标准化,以消除变量在水平和量纲上的影响
根据标准化后的数据矩阵求出相关系数矩阵
求出协方差矩阵的特征根和特征向量
确定主成分,并对各主成分所包含的信息给予适当的解释
版本二:根据我国31个省市自治区2006年的6项主要经济指标数据,表二至表五,是SPSS的输出表,试解释从每张表可以得出哪些结论,进行主成分分析,找出主成分并进行适当的解释:(下面是SPSS的输出结果,请根据结果写出结论)
表一:数据输入界面
表二:数据输出界面a)
此表为相关系数矩阵,表示的是各个变量之间的相关关系,说明变量之间存在较强的相关系数,适合做主成分分析。观察各相关系数,若相关矩阵中的大部分相关系数小于0.3,则不适合作因子分析。
表三为各成分的总解释方差表。component为各成分的序号;initial Eigenvalues是初始特征值,total是各成分的特征值,% of variance是各成分的方差占总方差的百分比(贡献率)。Cumulative%是累计贡献率,表明前几个成分可以解释总方差的百分数。Extraction sums 是因子提取结果。
一般来说,当特征根需大于1,主成分的累计方差贡献率达到80%以上的前几个主成分,都可以选作最后的主成分。由表可知,第一个主成分的特征根为3.963,方差贡献率为66.052%,这表示第一个主成分解释了原始6个变量66.052%的信息,可以看出前两个成分所解释的方差占总方差的95.57%,仅丢失了4.43%的信息。因此最后结果是提取两个主成分。在extraction sums of squared loadings一栏,自动提取了前两个公因子,因为前两个公因子就可以解释总方差的绝大部分95.6%。
表四是表示各成分特征值的碎石图。可以看出因子1与因子2,以及因子2与因子3之间的特征值之差值比较大。而因子3、4、5之间的特征值差值都比较小,可以初步得出保留两个因子将能概括绝大部分信息。明显的拐点为3,因此提取2个因子比较合适。证实了表三中的结果。
碎石图(Scree Plot),从碎石图可以看到6个主轴长度变化的趋势。实践中,通常选择碎石图中变化趋势出现拐点的前几个主成分作为原先变量的代表,该例中选择前两个主成分即可。
表五是初始提取的成分矩阵,它显示了原始变量与各主成分之间的相关系数,表中的每一列表示一个主成分作为原来变量线性组合的系数,也就是主成分分析模型中的系数aij。
比如,第一主成分所在列的系数0.670表示第1个主成分和原来的第一个变量(人均GDP)之间的线性相关系数。这个系数越大,说明主成分对该变量的代表性就越大。
第一主成分(component 1)对财政收入,固定资产投资,社会消费品零售总额有绝对值较大的相关系数;第二主成分(component 2)对人均gdp,年末总人口,居民消费水平有绝对值较大的相关系数。可以分别对其进行命名。
版本一:根据我国31个省市自治区2006年的6项主要经济指标数据,进行因子分析,对因子进行命名和解释,并计算因子得分和排序。
表一数据输入界面:
表二因子分析SPSS输出界面a)
KMO统计量为0.695,接近0.7,表明6个变量之间有较强的相关关系。适合作因子分析。
Bartlett球度检验 统计量为277.025。检验的P值接近0,拒绝原假设,认为相关系数与单位阵有显著差异。可以因子分析。
表三因子分析SPSS输出界面b)
表三为公因子提取前
您可能关注的文档
- 地面架空电力线路、井下高压电缆选择计算表分解.doc
- (椭球、投影、变形)素材.ppt
- 活动课_认识欧洲分解.ppt
- 节约用水从我做起分解.ppt
- 3-1细胞生物学方法素材.ppt
- 地面深孔注浆方案分解.doc
- 多车型防盗匹配详细方法分解.doc
- 地面瓦斯抽放泵站事故应急处理c8分解.doc
- 地暖施工专项方案分解.doc
- 节约资源-全面建设节约型城市分解.ppt
- 艺术疗法行业商业机会挖掘与战略布局策略研究报告.docx
- 智能家庭娱乐系统行业商业机会挖掘与战略布局策略研究报告.docx
- 医疗纠纷预防和处理条例与医疗事故处理条例的思考分享PPT课件.pptx
- 新冀教版(2025)七年级数学下册《6.1 二元一次方程组》习题课件.pptx
- 新冀教版(2025)七年级数学下册精品课件:6.2.3 二元一次方程组的解法代入、加减消元法的综合应用.pptx
- 导演节目行业市场发展趋势及投资咨询报告.docx
- 制作和服培训行业风险投资态势及投融资策略指引报告.docx
- 医疗转诊的行政服务行业消费市场分析.docx
- 文件装订行业市场发展趋势及投资咨询报告.docx
- 在线语言艺术教育行业分析及未来五至十年行业发展报告.docx
最近下载
- 山西焦化废水深度处理技术方案【59页】.doc VIP
- 08【人教版英语字帖】八年级上册单词表衡水体字帖(新目标含音标).pdf VIP
- 《中国心力衰竭诊断和治疗指南 2024》解读PPT课件.pptx VIP
- 湖北省襄阳市樊城区达标名校2025届初三第一次联考试卷(物理试题理)试题含解析.doc VIP
- 没有任何借口DOC.doc
- 中压C-GIS的应用状况与发展趋势.PDF VIP
- 湖北省武汉市汉南区碧桂园小学2023-2024学年六年级下学期小升初招生语文试卷含答案.doc VIP
- 火电厂浓盐水处理工艺比选.ppt VIP
- 屏蔽机房施工组织设计.doc
- 17.水平三健美操18课时大单元计划.docx VIP
文档评论(0)