- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS讲义十课因子分析
因子分析
因子分析(Factor Analysis)是主成分分析的推广,它也是从研究相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。具体地说,就是要找出某个问题中可直接测量的、具有一定相关性的诸指标,如何受少数几个在专业中有意义,又不可直接测量到,且相对对立的因子支配的规律,从而可用诸指标的测定来间接确定诸因子的状态。
何为因子分析
因子分析的目的是用有限个不可观察的潜在变量来解释原变量间的相关性或协方差关系。在这里我们把不可观察的潜在变量称为公共因子(common factor)。在研究样品时,每个样品需要检测很多指标,假设测得个指标,但是这个指标可能受到()个共同因素的影响,再加上其他对这些指标有影响的因素。写成数学的形式就是:
(36.1) 利用矩阵记号有
(36.2) 各个指标变量都受到的影响,因此称为公共因子,称为因子载荷矩阵,是单变量所特有的因子,称为的特殊因子(unique factor)。设,,…,分别是均值为0,方差为1的随机变量,即;特殊因子,,…,分别是均值为0,方差为,,…,的随机变量,即;各特殊因子之间及特殊因子与公共因子之间都是相互独立的,即及。错误!未定义书签。是第个变量在第个公共因子上的负荷,从投影的角度看,就是在坐标轴上的投影。
主成份分析的目标是降维,而因子分析的目标是找出公共因素及特有的因素,即公共因子与特殊因子。在主成份分析中,残差通常是彼此相关的。在公因子分析中,特殊因子起到残差的作用,但被定义为彼此不相关且和公因子也不相关。而且每个公因子假定至少对两个变量有贡献,否则它将是一个特殊因子。在开始提取公因子时,为了简便还假定公因子彼此不相关且具有单位方差。在这种情况下,向量的协方差矩阵Σ可以表为
(36.3) 这里D=diag(),diag表示对角矩阵。如果假定已将错误!未定义书签。标准化,也就是说错误!未定义书签。的每一个分量的均值都为0,方差都是1,即,那么
(36.4) 记,则有
(36.5) 错误!未定义书签。反映了公共因子f对的影响,称为公共因子f对的“贡献”。实际反映了变量对公共因子f的依赖程度。
另一方面,还可以考虑指定的一个公共因子对各个变量的影响。实际上,对各个变量的影响可由中第列的元素来描述,那么
(36.6) 称为公共因子对的“贡献”。显然越大,对的影响就越大,成为衡量因子重要性的一个尺度。实际上
(36.7) 那么矩阵的统计意义就非常清楚:
错误!未定义书签。是和的相关系数;
错误!未定义书签。是对公共因子的依赖程度;
错误!未定义书签。是公共因子对的各个分量总的影响。
下面我们来看怎样求解因子载荷矩阵。
因子载荷矩阵的求解
如果已知协方差矩阵和,可以很容易地求出。根据(36.3)有
(36.8) 记,则是非负定矩阵。若记矩阵的p个特征值≥ ≥…≥ = … = = 0,且m个非零特征值所对应的特征向量分别为,,…,,则的谱分解式为
(36.9) 只要令
(36.10) 就可以求出因子载荷矩阵。
但在实际问题中,我们并不知道、,即不知道,已知的只是个样品,每个样品测得个指标,共有个数据,样品数据见表6.1所示。为了建立公因子模型,首先要估计因子载荷错误!未定义书签。和特殊因子方差。常用的参数估计方法有以下三种:主成份法、主因子解法和极大似然法。
主成份法
主成份法求因子载荷矩阵的具体求法如下:首先从资料矩阵出发求出样品的协方差矩阵,记之为,其特征值为,相应单位正交特征向量为,当最后个特征值较小时,则对进行谱分解可以近似为
(36.11) 其中≥ ≥…≥ 0是协方差矩阵相应的前个较大特征值。先取,然后看是否接近对角阵。如果接近对角阵,说明公共因子只要取一个就行了,所有指标主要受到这一个公共因子的影响;如果不是近似对角阵,就取,然后看是否接近对角阵,如果接近对角阵,就取两个公共因子;否则再取,…,直到满足“要求”为止。这里的“要求”要视具体情况而定,一般而言,就象主成分分析一样,直接取前个特征值和特征向量,使得它们的特征值之和占全部特征值之和的85%以上即可。此时,特殊因子方差。
主因子解法
主因子解法是主成份法的一种修正,它是从资料矩阵出发求出样品的相关矩阵,设,则。如果我们已知特殊因子方差的初始估计,也就是已知了先验公因子方差的估计为,则约相关阵为
(36.12) 计算的特征值和特征向量,取前个正特征值及相应特征向量为,则有近似分解式
(36.13) 其中,令,则和为因子模型的一个解,这个解就称为主因子解。
上面的计算是我们假设已知特殊因子方差的初始估计,那么特殊因子方差的初始估计值如何得到呢?由于在实际中特殊因子方差(或公因子方差)是未知的。以上得到的解是
您可能关注的文档
- KE-Q-进料检验记录表.doc
- JYR直流电阻测试仪(S)操作手册.doc
- KTH--两线控-有时钟-.doc
- Kzafpo高中物理基本概念定理定律公式(表达式)总表.doc
- K《管理数量方法》复习题.doc
- K土地退化和恢复专题评估的初步范围界定h.doc
- LA物理师部分考题.doc
- LC振荡器Mhz.doc
- LED电视概念大起底.doc
- linux下的DB命令.doc
- DB44_T+2756-2025碳达峰碳中和培训管理规范.docx
- DB44_T+2765-2025红树林主要病虫害综合防控技术规程.docx
- DB44_T+2757-2025五指毛桃林下栽培技术规程.docx
- DB44_T+2760-2025鳄蜥饲养技术规程.docx
- DB44_T+2754-2025中医医院老年病科病房适老化服务规范.docx
- 中西医临床患者报告结局测量工具选择系统的工作流规范.docx
- DB44_T+2767-2025河口海湾总氮、总磷水质评价指南.docx
- 中医药科技成果转化评价技术规范.docx
- DB44_T+2750-2025农村供水工程数字化建设技术导则.docx
- DB44_T+2769-2025金属矿山生态修复技术规范.docx
最近下载
- 老年人慢性支气管炎护理查房.pptx VIP
- 广东省惠州市博罗县2024-2025学年七年级上学期期末考试数学试题.pdf VIP
- 数据库优化PPT课件.pptx VIP
- 广东省惠州市惠阳区2024-2025学年七年级上学期期末生物学试题(含答案).pdf VIP
- 一种含铷矿中提取铷的新方法.pptx
- 广东省惠州市博罗县2024-2025学年七年级上学期期末考试英语试题.pdf VIP
- DB11T 2493-2025餐饮服务单位使用丙类液体燃料消防安全管理规范.pdf
- 如何找回误删微信好友,微信好友一键恢复.doc VIP
- 通航条件影响评价费用招标控制价计算表.doc VIP
- 一级圆柱齿轮减速器机制工艺规程编制.doc VIP
原创力文档


文档评论(0)