- 1、本文档共107页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计分析方法 主成分分析与因子分析 第一部分主成分分析 我们经常遇到有很多变量的数据。 在如此多的变量之中,有很多是相关的。 人们希望能够找出它们的少数“代表”(综合指标)来对它们进行描述。 下面介绍两种把变量维数降低以便于描述、理解和分析的方法:主成分分析(principal component analysis)和因子分析(factor analysis)。 主成分法的基本思想 考虑二维情形,即只有两个变量,它们由横坐标和纵坐标所代表;因此每个观测值都有相应于这两个坐标轴的两个坐标值; 这些数据大致分布于一个椭圆形的区域中,如下图所示: 这个椭圆有一个长轴和一个短轴。 在短轴方向上,数据变化很少;在极端的情况,短轴如果退化成一点,那只有在长轴的方向才能够解释这些点的变化了;这样,由二维到一维的降维就自然完成了。 如果长轴变量代表了数据包含的大部分信息,就用该变量代替原先的两个变量(舍去次要的一维),降维就完成了。 椭圆(球)的长短轴相差得越大,降维效果越好。 主成分法的数学模型 实际使用过程中,先将变量标准化 运用拉格朗日乘子法求约束条件下的极值: 令 得: 结论(以y1为例) 原变量相关系数矩阵的最大特征值即为y1的方差, 第二部分因子分析 一、因子分析的作用 因子分析的作用主要有两个: 1.数据简化 可为进一步应用其他统计方法(如相关分析、回归方法、判别分析法等)提供便利条件。 2.寻求变量的基本结构 二、因子分析的基本步骤 1.计算所有变量的相关矩阵,根据计算结果判断应用因子分析方法是否合适。如果各变量独立性较强,则不适合。 2.提取因子。该步要确定求因子解的方法,和提取因子的个数。 3.进行因子旋转,对旋转后的新因子作出实际意义解释。 4.计算因子值。即每个Case的各因子值(称为因子得分值) 三、因子分析法的基本操作 Analyze →Data Reduction →Factor… 打开Factor Analysis对话框 将参与因子分析的变量依次选入Variables框中 分别对“Extraction”, “Rotation”, “Scores” 等项进行设置. 单击“OK”即可 “Extraction”对话框选项 Method: Principal components (主成分分析,系统默认) Unweighted least square (普通最小二乘法) Generalized least squares (广义最小二乘法) Maximum likelihood (最大似然法) Principal Axis factoring (主轴因子法) Alpha (α因子提取法) Image (映像分析法) Extract:决定提取因子的个数 Eigenvalue over: 指定要提取因子的最小特征值,系统默认值为1 Number of factors:直接指定提取的因子个数。 Display:指定与初始因子有关的输出项 Unrotated factor solution:显示未旋转的因子解 Scree plot:显示碎石图,用于决定因子提取个数。 “Rotation”对话框选项 Method:选择因子旋转方法 None(不进行旋转) Varimax (方差最大法) Equamax (等量最大法) Quartimax (四次方最大法) Direct Oblimin (斜交旋转) Display:指定输出选项 Rotated solution:显示旋转后的因子解 Loading plots:显示因子载荷图 “Scores”对话框选项 Method:指定计算因子值方法 Regression:回归法 Bartlett:巴特利特法 Anderson-Rubin:安德森—鲁宾法 Save as variables:将因子值作为新变量保存在数据文件中。 例1 对公司业绩评价,选取了11个指标。 (详见“因子分析”数据文件) 本例目的: 将11个指标进行简化综合 判断“是否适合作因子分析” 请进行以下操作…………. 输出“碎石图” 请作以下操作……….. 进行因子旋转(一般都需要) 否则所得因子无法命名(缺乏实际经济意义) 操作………. 计算因子得分 操作………….. 要求因子载荷系数按大小顺序排列 操作………. 输出结果:相关系数矩阵 用于判断是否作因子分析 如果存在大量的接近零的相关系数,则不适合作因子分析。 KMO指标大于0.7时,适合作因子分析。 0.6以上,作因子分析还可以 0.6以上
您可能关注的文档
- 中药学(普通高校“十五”规划版)教案.ppt
- 中药学(中药材GAP)教案.ppt
- 学校甲流防控讲座教案.ppt
- 中药学(总论)教案.ppt
- 学校监测教案.ppt
- 中药学5化湿药教案.ppt
- 中药学24清热解毒教案.ppt
- 中药学补气药教案.ppt
- 中药学——补虚药活血化瘀药教案.ppt
- 学校健康安全培训教案.ppt
- 《GB/T 45311-2025潮流能转换装置 海上试验技术要求》.pdf
- GB/T 45311-2025潮流能转换装置 海上试验技术要求.pdf
- GB/T 17554.1-2025卡及身份识别安全设备 测试方法 第1部分:一般特性.pdf
- 中国国家标准 GB/T 17554.1-2025卡及身份识别安全设备 测试方法 第1部分:一般特性.pdf
- 《GB/T 17554.1-2025卡及身份识别安全设备 测试方法 第1部分:一般特性》.pdf
- 中国国家标准 GB/T 18655-2025车辆、船和内燃机 无线电骚扰特性 用于保护车载接收机的限值和测量方法.pdf
- 《GB/T 18655-2025车辆、船和内燃机 无线电骚扰特性 用于保护车载接收机的限值和测量方法》.pdf
- GB/T 18655-2025车辆、船和内燃机 无线电骚扰特性 用于保护车载接收机的限值和测量方法.pdf
- GB/Z 42749.7-2025信息技术 IT赋能服务业务过程外包(ITES-BPO)生存周期过程 第7部分:成熟度评估范例.pdf
- 《GB/Z 42749.7-2025信息技术 IT赋能服务业务过程外包(ITES-BPO)生存周期过程 第7部分:成熟度评估范例》.pdf
文档评论(0)