第七讲，因子分析.pptVIP

下载本文档

4
0
约2.68万字
约 73页
2018-04-01 发布于江西
举报
版权申诉

第七讲，因子分析.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第七讲，因子分析

因子分析因子分析最常用的数据简化手段因子分析的含义因子分析最早由心理学家发展起来，目的是借助提取出的公因子来代表不同的性格特征和行为取向，从而解释人类的行为和能力。由于在长期的实践中证实该方法能有效地提取变量间的内在结构，并能解决变量共线性等问题，现在已被应用到医学、社会学、市场营销等各个领域。与因子分析方法非常近似的有主成分分析，两者的主要区别是应用目的不同，在拟合过程上区别不大。因子分析与主成分分析的区别主成分分析是一种中间手段，其背景是研究中经常会遇到多指标的问题，这些指标间往往存在一定的相关性，直接纳入分析不仅复杂，变量间难以取舍，而且可能因多元共线性无法得出正确结论。主成分分析的目的就是通过线性变换，将原来的多个指标组合成相互独立的少数几个能充分反映总体信息的指标，从而在不丢掉主要信息的前提下避开了变量间共线性的问题，便于进一步分析。因子分析与主成分分析的区别提取出的主成分能包含主要信息即可，不一定非要有准确的实际含义。所以，主成分分析不能被看成是研究的结果，而应继续采用其它多元统计方法以解决实际问题。因子分析与主成分分析的区别因子分析也是一种将多变量化简的技术，它可以被看成是主成分分析的推广。事实上因子分析中最常用的因子提取法就是主成分法。因子分析的目的是分解原始变量，从中归纳出潜在的“类别”，相关性较强的指标归为一类，不同类间变量的相关性较低。每一类变量代表了一个“共同因子”，即一种内在结构，因子分析就是要寻找该结构。因子分析与主成分分析的区别因子分析一般要求提取出的公因子有实际含义，如果分析中各因子难以找到合适的意义，则可以通过适当的旋转，改变信息量在不同因子上的分布，最终方便对结果的解释。因子分析的用途解决共线性问题：利用主成分分析提取主要信息，然后使用提取出的主成分代替原变量进行分析，就可以避开原变量的共线性问题。寻找变量间潜在结构：许多变量是无法直接观测到的，它们往往需要用一系列可以直接观测的相关变量来间接反映。通过因子分析，就可以将平些变量间潜在的结构推导出来加以利用。因子分析在药学中的应用确定因子数确定未知样品中被测成分的个数确定反应体系中主要的影响因素色谱峰纯度的鉴别根据所分解的行矩阵及列矩阵对原始数据的固有的特征进行分析对已知组分数的定量分析对复杂背景中某成分的定量分析严重重叠色谱峰的定量分析因子分析的适用条件样本量要求样本量为变量数的10~20倍。总样本量不得小于100，而且越大越好。变量要求各变量间必须有相关性，否则各变量间没有共享信息，就不可能有公因子需要提取。在该条件的判断上，除了根据专业知识来估计外，还可以使用KMO统计量和Bartlett’s球形检验中以判定。因子分析过程分析化学中常用的因子分析方法目标因子分析秩消因子分析渐进因子分析目标因子分析原理只要一个多组分待测混合体系中的各个组分在一定的测试条件下的吸光度符合比耳定律，且各组分之间线性无关，则该混合体系在同样实验条件下的吸光度数据矩阵就具有可因子分析性。在某一波长处，该混合物的吸光度值可表示成目标因子分析原理对于一系列具有相同的组分，但各组分的浓度不相同的混合体系，其吸光度值对表示成 [A]=[E][C] 若有r份样品溶液，含有共n种组分，在w个波长处量测吸光度，那么，[A]就是一个w×r吸光度数据矩阵，[E]是w×n吸光系数矩阵，[C]为n×r浓度矩阵。目标因子分析原理从数学上讲，吸光度数据矩阵[A]完全可以分解成一个行矩阵[R]和一个列矩阵[C] [A]=[R][C] 此时，[R]为一个w×r阵，[C]为一个r×r阵目标因子分析原理如果采用行阵[R]和列矩阵[C]中的全部数据去进行运算则完全可以复原出原始数据矩阵[A]。假设对吸光度数据矩阵[A]有贡献的吸光化合物共有n个，那么，取矩阵[R]中的n列(构成矩阵[R*]）和矩阵[C]中的n行(构成矩阵[C*]）按[R*][C*]式运算便可得到一个复原阵，假设为[A*]，目标因子分析原理即么，[A*]就应该在误差范围内与[A]相一致，这时所得到的[R*]和[C*]分别被称为抽象行矩阵和抽象列矩阵。之所以冠以“抽象”一词，那是因为[R*]和[C*]均为纯数学上的抽象结果，它们都并不含有具体的物理或化学上的意义。目标因子分析原理如何从[A]来确定n的正确值，即如何寻找[A]的主因子解。从线性代数知识可知，寻找[A]的主因子解的问题可归结为求解[A]的协方差矩阵[Z]的特征值和特征向量的问题。如果有n 个组分，则有n 个特征值和与之对应的特征向量。目标因子分析原理由于实验误差的存在，所求得的[Z]的特征值和特征向量数将等于