网站大量收购独家精品文档,联系QQ:2885784924

(8-2)-主成分讲解.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析 分析目的:数据化简 通过线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映总体信息的指标,从而在不丢失主要信息的前提下避开了变量间的共线性问题,便于进一步分析。 主成分分析只是一种中间手段,提取的每个主成分都是原来多个指标的线性组合。 能包含主要信息即可,不一定要有准确的含义。 实例:5 心脏的指标有横径、纵径、宽径、胸腔横径以及心脏面积。因指标间存在较强的相关性,请从中提取适当数量的主成分,以替代原变量来进行以后的分析。 2)启动主成分分析过程 Analyze→Data Reducetion →Factor 3)设置主成分分析主对话框 4)选择描述统计量 5)公因子提取 5)公因子提取 5)公因子提取:指定与因子提取有关 的输出项 6)选择因子旋转方法 7)得分选择 8)输出选择:输出方式以及对带有缺 失值的观测量处理方法的选择项 练习5:对鸡体型性状:体斜长(x1)、胸深(x2)、胸宽(x3)、龙骨长(x4)、骨盆宽(x5)、胫长(x6),做主成分分析。 * * 主成分分析的适用条件 目的是提取信息,对样本量没有太严格的要求。 分析中是从变量中提取共同因素,因此,要求变量间具有相关性。 如何确定需要保留的主成分数量 1. 主成分的累积贡献率: >80%—85% 2. 特征根: 可认为是主成分影响力度的指标。一般以大于1为纳入标准。 3. 综合判断: 将前两者结合使用 1)准备分析数据 统计量栏 单变量描述统计量 初始分析结果 相关矩阵栏选项 相关系数 显著性水平 相关系数矩阵行列式 逆矩阵 再生矩阵 反映象相关阵 KMO和Bartlett检验 √ √ 指定提取方法 Principal components:主成份法 Unweighted least square:不加权最小平方法 Generalized least squares:加权最小平方法 Maximum likelihood:最大似然法 Principal axis factoring:主轴因子提取法 Alphafa ctoring:α因子提取法 Image factoring:映象因子提取法 分析矩阵 指定以分析变量的相关矩阵为提取因子的依据。 指定以分析变量的协方差矩阵为提取因子的依据。 该选择项指定提取的因子的特征值。 该选择顶指定提取公因子的数目。 指定因子分析收敛的最大迭代次数,默认25 提取进程和提取结果 . 指定与因子提取有关的输出项 要求显示未经旋转的因子提取结果 要求显示按特征值大小排列的因子序号,以特征值为两个坐标轴的碎石图。 不进行旋转 方差最大旋转 直接斜交旋转 四次方最大正变旋转 平均正交旋转 斜交旋转方 选择有关输出显示 选择旋转方法 旋转结果 因子载荷散点图 √ 将因子得分作为新变量保存在数据文件中 指定计算因子得分的方法 回归法 巴特利特法 安德森一鲁宾法 在输出窗中显示因子得分 处理缺失值方法 剔除 成对剔除 用均值代替 决定载荷系数的显示格式 按其数值的大小排列 不显示那些绝对值小于指定值的载荷系数 √ 9)结果分析 各变量描叙统计量 均值 标准差 样本量数 9)结果分析 原始变量的相关系数阵 可见相关性非常高,直接用于分析可能会有严重的共线性问题。 相关系数 概率值 9)结果分析 KMO和Bartlett检验结果 重要,结果用于判断数据能否进行因子分析。第一行为KMO统计量,接近0.9,说明各变量间的相关程度无太大差异,非常适合做因子分析。第二行为球形检验结果,可见球形假设被拒绝,5个指标间并非独立,取值是有关系的,适合做因子分析(P0.05时适合做因子分析)。 9)结果分析 公因子方差表 ?按照所选标准提取相应数量主成分后,各变量中信息分别被提取出的比例。此表说明除心脏宽径和胸腔横径外,其余变量信息提取充分。 提取因子之前的各变量的公因子方差。 各变量的未旋转的公因子方差。 9)结果分析 总方差分解:主成分列表 提取原则是特征值大于1。可见第一主成分特征根为4.245,解释了总变异的84.9%;其余特征根均小于1。说明该主成分的解释力度还没有原变量大。故,5个变量只提取出第一个即可。 各主成分的序号 特征值 因子提取结果 9)结果分析 碎石图 ?分析碎石图可见因子1与因子2之间的特征值之差值比较大。而2、3、4、5之间特征值差值均比较小。可以初步得出保留一个因子将能概括绝大部分信息。 9)结果分析 :因子负荷矩阵 Component1 = 0.969×心脏面积 + 0.95

文档评论(0)

琼瑶文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档