- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章 实用多元统计分析
(2)第i个主成分Yi的方差为第i个特征值λi,每两个不相同主成分间的协方差为0,则Y1,…,Ym的协方差矩阵S是一对角矩阵∧,其对角元素分别为λ1…λm,其他元素均为0。 (3)S和∧的对角元素之和相等,即两个协方差矩阵的迹相等 由此可得,第k个主成分的方差占总方差的比例= 称此为主成分Yk的贡献率。 则前K个主成分的累计贡献率= 《应用统计学》精品课程 (4)主成分Yi与Xj的相关系数 称为因子负荷量。 (5) 《应用统计学》精品课程 《应用统计学》精品课程 为了研究上海、北京房地产指数与其他价格指数之间的关系,设定4个变量,见表10.12。 表10.12 房地产指数变量 变 量 名 称 x1 中国房地产板块股票价格指数 x2 中国房地产北京城市指数 x3 中国房地产上海城市指数 x4 全国零售价格指数 10.3.5 应用实例 表中10.12中所有变量的数据均取自1997年1月~2000年6月有关的统计资料,样本容量为n=42。根据这些数据计算的样本相关矩阵为 其特征值为: λ1 =2.333, λ 2 =1.089 λ3 =0.540 λ4=0.038 对应的特征向量分别为 《应用统计学》精品课程 这样就可以得到4个主成份。其第一、第二主成份分别为 《应用统计学》精品课程 根据10.3.4小节中的结论(2)、(3)可以求出各个主成份的方差和方差贡献,见表10.13。 主成份 可解释的方差 方差贡献率 累计方差贡献率 Y1 2.333 0.583 0.583 Y2 1.089 0.272 0.855 Y3 0.540 0.135 0.990 Y4 0.038 0.010 1.000 ∑ 4.000 1.000 表10.13 方差贡献 由表10.13可见 ,前两个主成份的累计方差贡献率达到了85.5% 这 就 说明如用两个成分Y1 和 Y2 去代替原来的4个变量X1, X2 ,X3 ,X4的话,所不 能解释的方差不足15%,因此不致损失太多的信息 。利用(10.33)还可以 求出因子负荷,表10.14 给出了计算结果。 《应用统计学》精品课程 表10.14 因子负荷 变 量 Y1 Y2 X1 0.757 0.211 X2 -0.412 -0.874 X3 0.832 0.520 X4 0.948 -0.087 由因子负荷表可以看出第一主成份Y1和变量X1,X3 ,X4关系密切,因 此,它的意义或命名应根据X1,X3 ,X4的意义来决定;第二主成份Y2和X2 的关系最密切,而与X1,X3 ,X4的关系不密切。 《应用统计学》精品课程 《应用 统计学》精品课程 10.4 因子分析 Factor components analysis 10.4.1 因子分析的基本思想 10.4.2 子分析的数学表达式 10.4.3 正交因子模型与回归模型的比较 10.4.4 关于因子负荷的主要结论 10.4.5应用实例 《应用 统计学》精品课程 10.4.1因子分析的基本思想 因子分析的基本思想是将可以直接观测的变量进行分类,使彼此 之间相关性较密切的变量分在同一类中,且使不同类的变量之间的相关性尽量降低。这样每一类的变量实质上代表了一个本质因子。因子分析就是要寻找这种类型的模型或结构。 10.4.2因子分析的数学表达式 设m个变量的n个样品的观测数据矩阵为 由于X1,…Xm之间可能互相独立,也可能彼此相关,因此,我们将m个 变量Xi(i=1,…,m)表示成因子F1…FP以及因子ui(i=1,…,m)的线性组合 《应用统计学》精品课程 《应用统计学》精品课程 式中,FK(K=1,…P)与所有的变量X1,…Xm都有关,称为公共因子; 而ui(i=1,…m)仅与相应的一个变量Xi有关,称为单因子。公共因子的 系数aik(i=1,…p)称为第i个变量Xi在第k个公共因子FK上的因子载荷。 为讨论问题的方便,假定原始变量Xi、公共因子FK以及单因 子ui均已化为标准化,且各因子互相独立。若进一步假定公共 因子F1…FP满足 EFK=0 (K=1,…,P) Cov(FK,Ft)= 单因子u1,…,um满足 Eui=0 (i=1,…,m) Cov(ui,uj)= 以上模型称为正交因子模型。 《应用统计学》精品课程 10.4.3正交因子模型与回归分析比较 对于线性组合中的一个式子 与多元回归模型
原创力文档


文档评论(0)