数据分析方法与技术-因子分析实验报告
电子科技大学政治与公共管理学院
本科教学实验报告
(实验)课程名称:数据分析技术系列实验
电子科技大学教务处制表
电 子 科 技 大 学
实 验 报 告
学生姓名: 学 号:
指导教师:
一、实验室名称: 电子政务可视化实验室
二、实验项目名称:因子分析
三、实验原理
主成分分析:
由于多个变量之间都存在着相关性,故为了使复杂的问题更加清晰,因此就设计将原来的变量重新线性组合成若干个互不相关的综合指标来代替原来的变量,并尽可能提取原来变量的信息来解释原有变量的协方差结构,这就是主成分分析法(Principal Component Analysis)。
主成分分析的数学模型:
设有n个变量,每个样品有p个变量对其作线性组合得到:
这里限制性要求:
第i主成分的贡献率为:
表明第i个主成分综合的信息的能力
累计贡献率为:
表示前m个主成分包含了原变量所具有的信息量。
因子分析:
其中X是可实测的p 个指标所构成的 p 维随机向量;F 是公共因子或潜因子,即前面所说的综合变量;称 aij 为因子载荷,是第 i 个变量在第 j 个公共因子上的负荷;矩阵 A 称为因子载荷矩阵;ε 是X
因子分析的几个重要概念:,即第 i 个变量与第 j 个公共因子的相关系数, 它的统计意义就是第 i 个变量在第 j 个公共因子上的负荷, 反映了第 i 个变量在第 j 个公共因子上的 相对重要性。
2、变量共同度Communalities
3、公共因子 Fj 的方差贡献
4、因子旋转
因子旋转的目的是为了使得因子载荷阵的结构简化,便于对公共因子进行解释。这里所谓的结构简化是使每个变量仅在一个公共因子上有较大的载荷,而在其余公共因子上载荷比较小。这种变换因子载荷阵的方法称为因子轴的旋转。旋转的方法有很多种,如正交旋转,斜交旋轴等。
5、因子得分
因子分析的数学模型是将变量表示成公共因子的线性组合,而在实际应用中,往往需要用公共因子去代表原始变量,即将公共因子表示为变量的线性组合,即
上式是因子得分函数,用它来计算每个样品的公共因子得分。估计因子得分有很多种方法,比如加权最小二乘法,回归法等。
四、实验目的
理解因子分析的基本原理,掌握在SPSS软件中因子分析的主要参数设置及其含义,掌握SPSS软件分析结果的含义及其分析。
五、实验内容及步骤
实验内容一:以城市基础设施调查数据为基础,运用因子分析方法对数据进行分析。
(1) 问题描述
对我国主要城市的市政基础设施情况进行因子分析。
(2) 因子分析Factor Analysis 过程调用
(3) 分析变量设置及参数选择
实验内容二:
(1) 问题描述
对主要城市日照数进行因子分析。
(2) 因子分析Factor Analysis 过程调用
(3) 分析变量设置及参数选择
六、实验器材(设备、元器件):
计算机、打印机、硒鼓、碳粉、纸张
七、实验数据及结果分析
实验一分析结果及讨论
分析结果如下列表示。
[DataSet1] C:\Users\a\Desktop\罗应婷 书配套光盘\配套数据文件\第12章\各地区城市市政设施.sav
Correlation Matrix 年末实有道路长度(公里) 年末实有道路面积(万平方米) 城市桥梁(座) Correlation 年末实有道路长度(公里) 1.000 .983 .783 年末实有道路面积(万平方米) .983 1.000 .738 城市桥梁(座) .783 .738 1.000 城市排水管道长度(公里) .939 .940 .759 城市污水日处理能力(万立方米) .896 .853 .873 城市路灯(盏) .883 .867 .719
Correlation Matrix 城市排水管道长度(公里) 城市污水日处理能力(万立方米) 城市路灯(盏) Correlation 年末实有道路长度(公里) .939 .896 .883 年末实有道路面积(万平方米) .940 .853 .867 城市桥梁(座) .759 .873 .719 城市排水管道长度(公里) 1.000 .845 .916 城市污水日处理能力(万立方米) .845 1.000 .822 城市路灯(盏) .916 .822 1.000 表1.1
从表1.1可以看出,各个变量之间都具有一定的相关关系而且有些相关系数还比较大,接近于所以本例很适合使用主成分分析。KMO and Bartletts Test Kaiser-Meyer-Olkin Mea
原创力文档

文档评论(0)