网站大量收购独家精品文档,联系QQ:2885784924

卫生统计学:主成分分析与因子分析教材教学课件.ppt

卫生统计学:主成分分析与因子分析教材教学课件.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
毕业论文毕业设计开题报告论文报告设计报告可行性研究报告

主成分分析与 因子分析;       多变量大样本分析中,变量间存在共线性,增加了分析的复杂性。若分别分析各个指标,分析有可能是孤立的,而不是综合的;盲目地减少指标又有可能损失很多信息,得出错误结论。欲采用较少指标,反映原资料大部分信息,可采用主成分分析和因子分析。; 主成分分析;概 念;主成分的几何意义;;其中( )分别是变量相关阵的前q个特征根对应的特征向量。 的方差分别是q个特征根λ1≥λ2≥…≥λq。( )’是第i个变量在各个主成分上的载荷。而实际上载荷往往是指 ,它是第i个 变量在各个标准化主成分上的载荷。据此可用最小二乘法解得标准主成分得分。标准化主成分的方差为1。;e=(e1,e2,…,ep)’为特殊因子(specific factor) f和e均为不可直接观测的随机变量 μ=(μ1,μ2,…,μp)’为总体x的均值 A=(aij)p*m为因子负荷(载荷)(factor loading)矩阵 ;通常先对x作标准化处理,使其均值为零,方差为1.这样就有 假定(1)fi的均数为0,方差为1; (2)ei的均数为0,方差为δi; (3) fi与ei相互独立. 则称x为具有m个公共因子的因子模型;如果再满足(4)fi与fj相互独立(i≠j),则称该因子模型为正交因子模型。 正交因子模型具有如下特性: x的方差可表示为 设;(1)hi2是m个公共因子对第i个变量的贡献,称为第i个共同度(communality)或共性方差,公因子方差(common variance) (2)δi称为特殊方差(specific variance),是不能由公共因子解释的部分 ;因子载荷(负荷)aij是随机变量xi与公共因子fj的相关系数。 设 称gj2为公共因子fj对x的“贡献”,是衡量公共因子fj重要性的一个指标。;二、因子分析的步骤;4.确定公共因子数; 5.计算公共因子的共性方差hi2; 6.对载荷矩阵进行旋转,以求能更好地解释公共因子; 7.对公共因子作出专业性的解释。 ;三、因子分析提取因子的方法; 每一个公共因子的载荷系数之平方和等于对应的特征根,即该公共因子的方差。 ;极大似然法(maximum likelihood factor) 假定原变量服从正态分???,公共因子和特殊因子也服从正态分布,构造因子负荷和特殊方差的似然函数,求其极大,得到唯一解。;主因子法(principal factor) 设原变量的相关矩阵为R=(rij),其逆矩阵为R-1=(rij)。各变量特征方差的初始值取为逆相关矩阵对角线元素的倒数,δi’=1/rii。则共同度的初始值为(hi’) 。; 以(hi’)2代替相关矩阵中的对角线上的元素,得到约化相关矩阵R’ 。 ;迭代主因子法(iterated principal factor) 主因子的解很不稳定。因此,常以估计的共同度为初始值,构造新的约化矩阵,再计算其特征根及其特征向量,并由此再估计因子负荷及其各变量的共同度和特殊方差,再由此新估计的共同度为初始值继续迭代,直到解稳定为止。;因子载荷(负荷)aij是随机变量xi与公共因子fj的相关系数。 设 称gj2为公共因子fj对x的“贡献”,是衡量公共因子fj重要性的一个指标。;四、因子旋转;(1)方差最大正交旋转(varimax orthogonal rotation) 基本思想:使公共因子的相对负荷(lij/hi2)的方差之和最大,且保持原公共因子的正交性和公共方差总和不变。 可使每个因子上的具有最大载荷的变量数最小,因此可以简化对因子的解释。;(2)斜交旋转(oblique rotation) 因子斜交旋转后,各因子负荷发生了较大变化,出现了两极分化。各因子间不再相互独立,而彼此相关。各因子对各变量的贡献的总和也发生了改变。 适用于大数据集的因子分析。 ;五、因子得分;Bartlett法 Bartlett因子得分是极大似然估计,也是加权最小二乘回归,得到的因子得分是无偏的,但计算结果误差较大。 因子得分可用于模型诊断,也可用作进一步分析的原始资料。 ;六、因子分析应用的注意事项;样本量 没有估计公式。至少要保证样本相关系数稳定可靠。 因子数目 一般认为,累积贡献要达到80%以上。但要注意Heywood现象。;谢谢

文档评论(0)

yuzongxu123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档