- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元统计学3因子分析
* 唐启义 qytang@ Tel: 139浙江大学农业与生物技术学院 1.用较少的因子表示原来的变量; 2.目的是尽可能保持原变量相互关系(结构)原则下;寻找变量的公共因子。 3.参数估计,指定几个公因子,将其还原成相关系数矩阵,在和原样本相关矩阵最相似(最大似然法)原则下,估计各个公因子的估计值。 4.应用:找到具有本质意义的少量因子来归纳原来变量的特征(因子降维、潜在因子) * * 因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。 例子:稻米品质评价 例如,在作物的产量、品质性状研究中,我们可以通过一些指标构成的评价体系,评价作物在各个方面(每个方面可能含有几个指标、或变量)的优劣。 加工精度、 水分、杂质、糠粉、矿物质、稗粒、谷粒、小碎米、不完善粒、气味、色泽、 籽粒长、长宽比、阴糯率、白度、垩白率、垩白度、透明度、碱消值、胶稠度、直链淀粉、蛋白质、气味、色泽、形态、适口性、滋味、食味评价 * 这么多的指标,能否归纳为若干个方面(公因子) * * 因子分析的数学模型为: 原变量被表示为公共因子的线性组合,当载荷矩阵旋转之后,公共因子可以做出解释,通常的情况下,我们还想反过来把公共因子表示为原变量的线性组合。 因子得分函数: 可见,要求得每个因子的得分,必须求得分函数的系数,而由于pm,所以不能得到精确的得分,只能通过估计。 * 如果有3个公因子, 称它们是不可观测的潜在因子(假想变量)。我们研究的多个变量共享这三个因子,但是每个变量又有自己的个性,不被包含的部分 ,称为特殊因子: * 因子分析与主成分分析区别 主成分分析仅仅是变量变换,而因子分析需要构造(假想变量)的因子模型。 主成分分析:原始变量的线性组合表示新的综合变量,即主成分; 因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。 常用的公共因子参数估计方法 * (一)主成分分析法 (二)主因子法 (三)极大似然估计法(正态分布) (四)最小二乘法 哪个方法好,不同数据不一样,须根据DPS提供的统计检验来确定。 因子旋转 因子分析不仅仅要找出公共因子以及对变量进行分组,更重要的要知道每个公共因子的意义,以便进一步分析,如果每个公共因子含义不清,则不便于实际背景解释。由于因子载荷阵是不惟一的,所以应该对因子载荷阵进行旋转--使因子载荷阵结构简化,即载荷矩阵每列或行的元素平方值向0和1两极分化。 * 什么时候使用斜交旋转 一般情况下,对因子载荷实施正交旋转; 如果正交旋转之后,因子载荷0-1两极分化还不是很理想,这时可以试试斜交旋转的方法。 * 因子得分 * 用公共因子来还原样本点的空间结构(类似主成分分析)。 得到的因子作为自变量来做回归分析,用于对样本进行分类或评价。 因子分析流程图 * 初始因子模型 正交旋转 或 斜交旋转 因子命名、构造模型及评价 KMO, Bartlett球形检验,判断是否适宜作因子分析 计算相关系数矩阵 因子个数确定 1.累计贡献, 2.Kaiser-Guffman 3.Scree Test, 4.Bartlett Test 因子提取方法 1.PC法, 2.主因子法 3.最大似然法, 4.不加权LS法 5.主轴因子法, 6.Alpha 因子分析例子 * 数学 物理 化学 语文 历史 英语 65 61 72 84 81 79 77 77 76 64 70 55 67 63 49 65 67 57 80 69 75 74 74 63 74 70 80 84 81 74 78 84 75 62 71 64 66 71 67 52 65 57 77 71 57 72 86 71 83 100 79 41 67 50 86 94 97 51 63 55 74 80 88 64 73 66 67 84 53 58 66 56 81 62 69 56 66 52 71 64 94 52 61 52 78 96 81 80 89 76 69 56 67 75 94 80 77 90 80 68 66 60 84 67 75 60 70 63 62 67 83 71 85 77 提取方法和因子个数
文档评论(0)