2011暑期集训专题七——因子分析专题2011-07-13.ppt

2011暑期集训专题七——因子分析专题2011-07-13.ppt

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
方差极大正交旋转 因子坐标系正交旋转的目的主要是寻求适当正交变换矩阵, 使得 中矩阵B的结构尽可能简单:每列仅有少数几 个元素绝对值接近1,大部分接近于0,即要求因子仅与少 量变量的关系密切。 方差极大准则(Varimax):为运算方便,要求B矩阵的每行 元素的平方有尽可能大的方差。 四次幂极大正交旋转:主要是清理因子载荷矩阵的行。此外 还可以清理载荷矩阵的列,这涉及到因子载荷的四次幂,故 称四次幂最大准则(Quartimax)。 3.3 斜交因子解 有时由于数据自身的原因,正交因子旋转无法达到前述目的,需要进行斜交因子旋转。 斜主因子解:因子轴 分别穿过数据组的重心位置,但不满足 。 斜参因子解:找到斜主因子解之后,就可以建立斜参因子轴即斜交因子参考轴:令 ,它们都可以通过某组正交因子解的斜交变换得到。 斜交因子解的原则是尽可能使变量落在主轴附近,或使得变量在参考轴上投影为0。 图3.因子轴斜交投影示意图 几点说明 通过主成分分析得到的主因子解是因子分析的基础,概念 还比较笼统,若仅仅满足于变量的约简与正交,这已经足 够了。但若需要开展某些系统分析,需要进一步求解;正 交因子解可以进一步给出清晰的因子-变量关系和因子结构, 若此时分析结论符合实际,则不必寻求斜交解;一般来说, 斜交因子解可以给出较符合实际的因子解的结构,据此可 以得到更符合实际的结论。 4 实例分析 某层控铅锌矿品位高规模大,矿体赋存于古喀斯特裂隙溶洞中。考察发现,矿区含银,且局部达到工业品味。为对该层控铅锌矿开展综合评价,在矿体不同部位采集了4块样本分别化验Pb,Zn,Ag的含量,再进行因子分析。标准化数据见下表: 表3.标准化数据表 首先计算主因子解(主成分) 数据表为矩阵形式即为 由此得相关系数矩阵 由此得特征多项式 解得 图3.特征值递减折线图 根据特征值求出相应的特征向量,进而得到因子载荷 和公因子及方差贡献表 图4.因子载荷图 成分得分系数矩阵,是载荷矩阵各列除以对应特征值得到的 结果,例如 至于成分得分协方差矩阵则是因子得分的相关系数,因子得分表格如下: 从载荷表中可看出,第一因子方差贡献为2.778(92%),但各个变量的载荷都很大;主成分分布图上,Ag距第一因子较远,看不出变量之间的亲疏关系,需要做正交旋转。 正交旋转 采用方差极大正交旋转(Varimax)方法,用原因子载荷矩阵 乘以变换矩阵T,即得旋转后的因子载荷矩阵: ,其 中 至于成分得分系数矩阵,计算方法为 正交变换后的因子载荷如下表所示: 图5.正交旋转后的因子载荷图 对比图4和图5可看出,相对于正交因子轴,斜交因子轴旋转了39.5度,使得第一因子轴与变量Pb,Zn靠近,第二因子轴与Ag接近,变量与因子的关系更为清晰,明确。 斜交因子解 若进行因子旋转,则可以借助斜交因子参考轴得到斜交因 子解,常用的解法是Oblimin,结果如下: 在主因子解和正交因子解中,因子载荷即变量与因子间的 相关系数;斜交解中,因子载荷不再等于变量与因子相关 系数,可以得到两组参量: 一是因子图式矩阵(Factor Pattern):相当于因子载荷,但绝 对值不限于0-1之间。因它不再是因子与变量的夹角余弦。 二是因子结构(Factor Structure)矩阵,是因子与变量的相关 系数。 图6.斜交旋转后的因子载荷图 因子得分不再是正交变量,而是具有32.2度的夹角,因子之间的相关系数矩阵为: 用因子图式矩阵乘以因子相关矩阵,可得因子结构矩阵,这意味着,因子与变量的相关关系可由因子间的相关关系与因子载荷给出。 谢谢大家~~~ 2011数学建模集训班专题 曾九孙 2011/7/13 专题七 因子分析 1 基本概念 2 概述 3 因子分析 4 实例分析 1 基本概念 (1)均值(mean) 均值作为一组数据的代表,反映该组数据平均水平,计算公式如下: 性质1: Matlab命令:mean(x) (2)方差(variance) 方差用于衡量数据的集中或分散程度,公式为: Matlab命令:var(x) 标准差(standard deviation)是观测值与均值间的平均距离,公式为: Matlab命令:std(x) 图1.不同方差数据示意图 (3)协方差(variance) 协方差用于衡量数据的协变趋势,公式为: matlab命令:cov(x,y) (4)均方误差(mean square error) 用于衡量实际数据与预测数据的偏离程度,公式为:

文档评论(0)

天马行空 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档