主成分与因子.x分析报告.pptVIP

  1. 1、本文档共94页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1 主 成 分 分 析 与 因 子 分 析 Principal Components Analysis Factor Analysis 安徽医科大学公共卫生学院 潘发明 2 主要内容: 第一节 主成分分析 第二节 因子分析 3 第一节 主成分分析 Principal Components Analysis 4 一、基本思想 数据的降维、数据的解释 将原来众多具有一定相关性的指标,组 合成一组新的相互无关的综合指标。 从中选取几个较少的综合指标尽可能多 的反映原来众多指标的信息。 这种既减少了指标的数目又抓住了主要矛 盾的做法有利于问题的分析和处理。 5 6 如何利用这些指标对每一儿童的生长发育 作出正确评价? 仅用单一指标: 结论片面;难免带有偏性; 没有充分利用原有数据信息。 利用所有指标: 各指标评价的结论可能不一致,使综合 评价困难; 工作量大。 7 找出几个综合指标(长度、围度等),这些综合指标是原始指标的线性组合,既保留了原始指标的信息,且互不相关,从而达到降维。 各综合指标提供的“信息”量大小用其方差来衡量。 衡量一个指标的好坏除了正确性与精确性外,还必须能充分反映个体间的变异,一 项指标在个体间的变异越大,提供的信息 量越多。 8 主成分的概念 例题 对几个儿童测量了身高(x1)、体重(x2)两个指标。显然x1与x2间是高度相关的,即身高包含了体重的信息,体重也同样包含了身高的信息。若以x1为横轴x2为纵轴作散点图,可以发现几个个体的散点分布在一条直线附近。 9 10 11 12 13 如何用SPSS软件中的菜单进行标准化转化? 14 15 16 17 18 可依此类推,直到求出第m主成份。 19 20 (二)主成分的性质 21 22 主成分个数的选取 (1)前k个主成分的累积贡献率70%。 (2)主成分Ci的特征值i ≥ 1。 23 主成份分析的应用 主成分分析本身往往并不是目的,而是达到目的的一种手段。因此,它多用在大型研究项目的某个中间环节中。例如,把它用在多元回归中,便产生了主成分回归,这种回归具有一些优良性质。另外,它还可以用于聚类、判别分析等。这里主要介绍主成分评价和主成分回归。 24 25 实例 原始的数据库结构 26 原始数据标准化转化(消除度量衡不同的影响) 27 六个变量的标准化转化值自动保存在原始数据库中 28 各变量标准化值相关系数矩阵 29 由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率 方差分析主成分提取表 初始因子载荷矩阵 30 主成分分析的结果 如何来判断 31 因为“Component Matrix”是指初始因子载荷矩阵, 每一个载荷量表示主成分与对应变量的相关系数。 用主成分载荷矩阵 中的数据除以主成分相对应的特征值开平方根便得到1个主成分中每个指标所对应的系数。将初始因子载荷矩阵中的1列数据输入( 可用复制粘贴的方法) 到数据编辑窗口( 为变量B1) , 然后利用“Transform→Compute Variable”, 在Compute Variable对话框中输入“A1=B1/SQR(4.417)。将得到的特征向量与标准化后的数据相乘, 然后就可以得出主成分表达式[注: 因本例只是为了说明如何在SPSS 进行主成分分析, 故在此不对提取的主成分进行命名, 有兴趣的读者可自行命名。 32 2.列出主成分表达式 C1=0.439*Z常识+0.440*Z算术+0.330*Z理解+0.305*Z填图+0.395*Z积木+0.436*Z译码 后根据主成分值排序进行综合评价 如果有多个主成分可以得到主成分综合模型 C=[∑( 1 *C1 +2 *C2 …+… K *CK )]/m(具体例题见PDF文件) 33 主成分分析的应用 1.对原始指标进行综合 以互不相关的较少个综合指标反应众多原 始指标提供的信息。 主成分回归(解决多元共线问题)。 2.对个体进行综合评价 34 3.进行探索性分析 利用因子载荷阵,找出影响各综合指标的 主要原始指标。 4.对样品进行分类 利用主成分得分对样品进行分类: C1为急性炎症成分 C2为慢性炎症成分 C3为癌变成分 35 主成分回归 36 37 38 39 40 主成分分析的正确应用 41 42 43 第二节 因子分析 Factor Analysis 44 一、因子分析基本思想 从分析多个可观测的原始指标的相关关系入手,找到支配这种相关关系的有限个不可观测的潜在变量。是多元分析中处理降维的一种统计方法(概念起源于20世纪初Ka

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档