- 1、本文档共106页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
主成分分析和因子分析;汇报什么?;主成分分析;成绩数据(student.sav);从本例可能提出的问题;空间的点;撅缘沽逸担莲朽臀换肘动枚旱游匙方碉熔抨湖狂太止徊咒蒂殿沟洁闸旅旁主成分分析实例及含义讲解主成分分析实例及含义讲解;椭球的长短轴;呢红旱眯性坝伏泪猩迂塑樱绢瘤帜横汗锹炎赴协潞抽想惕渺南后谭辽献派主成分分析实例及含义讲解主成分分析实例及含义讲解;主轴和主成分;主成分之选取;主成分分析的数学;对于我们的数据,SPSS输出为;特征值的贡献还可以从SPSS的所谓碎石图看出;怎么解释这两个主成分。前面说过主成分是原始六个变量的线性组合。是怎么样的组合呢?SPSS可以输出下面的表。;如用x1,x2,x3,x4,x5,x6分别表示原先的六个变量,而用y1,y2,y3,y4,y5,y6表示新的主成分,那么,第一和第二主成分为;可以把第一和第二主成分的载荷点出一个二维图以直观地显示它们如何解释原来的变量的。这个图叫做载荷图。;该图左面三个点是数学、物理、化学三科,右边三个点是语文、历史、外语三科。图中的六个点由于比较挤,不易分清,但只要认识到这些点的坐标是前面的第一二主成分载荷,坐标是前面表中第一二列中的数目,还是可以识别的。;因子分析;主成分分析与因子分析的公式上的区别;因子分析的数学;对于我们的数据,SPSS因子分析输出为;这个表说明六个变量和因子的关系。为简单记,我们用x1,x2,x3,x4,x5,x6来表示math(数学),phys(物理),chem(化学),literat(语文),history(历史),english(英语)等变量。这样因子f1和f2与这些原变量之间的关系是(注意,和主成分分析不同,这里把成分(因子)写在方程的右边,把原变量写在左边;但相应的系数还是主成分和各个变量的线性相关系数,也称为因子载荷):;良追刺梯寝蕊作线燃瘤堕懂除衍匀稗逐投钟寅甘冻殴虎毅秤疏沁搭番扫贪主成分分析实例及含义讲解主成分分析实例及含义讲解;这里,第一个因子主要和语文、历史、英语三科有很强的正相关;而第二个因子主要和数学、物理、化学三科有很强的正相关。因此可以给第一个因子起名为“文科因子”,而给第二个因子起名为“理科因子”。从这个例子可???看出,因子分析的结果比主成分分析解释性更强。;这些系数所形成的散点图(在SPSS中也称载荷图)为;计算因子得分;该输出说明第一和第二主因子为(习惯上用字母f来表示因子)可以按照如下公式计算,该函数称为因子得分(factorscore)。;SPSS实现(因子分析与主成分分析);因子分析和主成分分析的一些注意事项;主成分分析
(PrincipalComponentsAnalysis);洛衫矶对12个人口调查区的数据;动机;如果有变量x1,...,xp,数学上可以把它们变换成一组新的变量(称为成分)y1,...,yp,使得:
(1)每一个y是那些x的线性组合,即yi=ai1x1+…+aipxp;(Y=a’X)
(2)系数aij的平方和为1,即
ai=(ai1,...,aip)T是单位向量;
(3)y1是这样的线性组合中方差最大的,y2为和y1不相关的线性组合中使方差最大的,如此下去,一般地,yj为与y1,y2,…,yj-1都不相关的方差最大的线性组合.;头几个变量(主成分)由于其方差最大,往往包含了绝大部分信息,人们就可以用它们来描述原来用p个变量所代表的现象.简化也就完成了.;矩阵情况;向量X的线性组合a’X的方差为
Var(a’X)=a’Cov(X)a;
Cov(X)未知;于是用X的样本相关阵R来近似.因此,我们要寻找向量a使得
a’Ra最大;的p×p矩阵.而对于观测值X=(x1,…,xp),其中xi=(x1i,…,xni),i=1,…,p,的样本相关阵第(ij)-元素为;关于特征值和特征向量
特征方程|R-lI|=0的解为特征值l,这里R为一个p维正定方阵.l通常有p个根l1≥l2≥…≥lp.满足(R-liI)xi=0的向量xi为li的特征向量.对任意向量a有性质;为了我们简化的目的,通常选取特征值最大的几个特征向量作为代表.
利用计算机软件就自动地得到这些特征值和特征向量.
由于变量不同的尺度会影响结果,因此,在各变量尺度差别大时,一般可以用样本相关阵而不是协方差阵来做(这通常在软件的选项之中).;步骤;取上面几个行向量组成所需的主成分变换矩阵.主成分i为:
yi=ai1x1+…+aipxp(yi贡献率为li/∑jlj);第一主成分:使Var(a1’X)最大的单位向量a1(a1’a1=1);而l1=a1’Ra1=Var(a1’X);这里R为X的相关阵.
第二主成分:满足Cov(a1’X,a2’
您可能关注的文档
最近下载
- 老年髋部骨折患者围术期下肢深静脉血栓基础预防专家共识(2024版).pdf VIP
- 华为ICT大赛云赛道认证考试复习题库(含答案).pdf VIP
- 北师大版六年级数学上册期中期末试题及答案.pdf VIP
- 2021-2022年中国ESG行业研究报告.pptx
- 第一单元峥嵘岁月 第1课情感表达 教学设计 人教版初中美术七年级上册.pdf
- 2024年秋新人教版地理七年级上册课件 4.1 多变的天气.pptx
- 人教版九年级全册英语Unit 14大单元整体教学设计.docx
- 大单元教学中的项目化学习——以五年级上册民间故事单元为例.docx
- 全员专项学习培训试题题库单选、多选试题附答案.doc VIP
- 22G101-3 混凝土结构施工图平面整体表示方法制图规则和构造详图(独立基础、条形基础、筏形基础、桩基础).docx
文档评论(0)