- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据分析方法和技术-因子分析实验报告
电子科技大学政治与公共管理学院
本科教学实验报告
(实验)课程名称:数据分析技术系列实验
电子科技大学教务处制表
电 子 科 技 大 学
实 验 报 告
学生姓名: 学 号:
指导教师:
一、实验室名称: 电子政务可视化实验室
二、实验项目名称:因子分析
三、实验原理
主成分分析:
由于多个变量之间都存在着相关性,故为了使复杂的问题更加清晰,因此就设计将原来的变量重新线性组合成若干个互不相关的综合指标来代替原来的变量,并尽可能提取原来变量的信息来解释原有变量的协方差结构,这就是主成分分析法(Principal Component Analysis)。
主成分分析的数学模型:
设有n个变量,每个样品有p个变量对其作线性组合得到:
这里限制性要求:
第i主成分的贡献率为:
表明第i个主成分综合的信息的能力
累计贡献率为:
表示前m个主成分包含了原变量所具有的信息量。
因子分析:
其中X是可实测的p 个指标所构成的 p 维随机向量;F 是公共因子或潜因子,即前面所说的综合变量;称 aij 为因子载荷,是第 i 个变量在第 j 个公共因子上的负荷;矩阵 A 称为因子载荷矩阵;ε 是X
因子分析的几个重要概念:,即第 i 个变量与第 j 个公共因子的相关系数, 它的统计意义就是第 i 个变量在第 j 个公共因子上的负荷, 反映了第 i 个变量在第 j 个公共因子上的 相对重要性。
2、变量共同度Communalities
3、公共因子 Fj 的方差贡献
4、因子旋转
因子旋转的目的是为了使得因子载荷阵的结构简化,便于对公共因子进行解释。这里所谓的结构简化是使每个变量仅在一个公共因子上有较大的载荷,而在其余公共因子上载荷比较小。这种变换因子载荷阵的方法称为因子轴的旋转。旋转的方法有很多种,如正交旋转,斜交旋轴等。
5、因子得分
因子分析的数学模型是将变量表示成公共因子的线性组合,而在实际应用中,往往需要用公共因子去代表原始变量,即将公共因子表示为变量的线性组合,即
上式是因子得分函数,用它来计算每个样品的公共因子得分。估计因子得分有很多种方法,比如加权最小二乘法,回归法等。
四、实验目的
理解因子分析的基本原理,掌握在SPSS软件中因子分析的主要参数设置及其含义,掌握SPSS软件分析结果的含义及其分析。
五、实验内容及步骤
实验内容一:以城市基础设施调查数据为基础,运用因子分析方法对数据进行分析。
(1) 问题描述
对我国主要城市的市政基础设施情况进行因子分析。
(2) 因子分析Factor Analysis 过程调用
(3) 分析变量设置及参数选择
实验内容二:
(1) 问题描述
对主要城市日照数进行因子分析。
(2) 因子分析Factor Analysis 过程调用
(3) 分析变量设置及参数选择
六、实验器材(设备、元器件):
计算机、打印机、硒鼓、碳粉、纸张
七、实验数据及结果分析
实验一分析结果及讨论
分析结果如下列表示。
[DataSet1] C:\Users\a\Desktop\罗应婷 书配套光盘\配套数据文件\第12章\各地区城市市政设施.sav
Correlation Matrix 年末实有道路长度(公里) 年末实有道路面积(万平方米) 城市桥梁(座) Correlation 年末实有道路长度(公里) 1.000 .983 .783 年末实有道路面积(万平方米) .983 1.000 .738 城市桥梁(座) .783 .738 1.000 城市排水管道长度(公里) .939 .940 .759 城市污水日处理能力(万立方米) .896 .853 .873 城市路灯(盏) .883 .867 .719
Correlation Matrix 城市排水管道长度(公里) 城市污水日处理能力(万立方米) 城市路灯(盏) Correlation 年末实有道路长度(公里) .939 .896 .883 年末实有道路面积(万平方米) .940 .853 .867 城市桥梁(座) .759 .873 .719 城市排水管道长度(公里) 1.000 .845 .916 城市污水日处理能力(万立方米) .845 1.000 .822 城市路灯(盏) .916 .822 1.000 表1.1
从表1.1可以看出,各个变量之间都具有一定的相关关系而且有些相关系数还比较大,接近于所以本例很适合使用主成分分析。KMO and Bartletts Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .856 Bartletts Test of Sphericity
文档评论(0)