- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
特征值、方差比例和累积贡献率 本例考虑保留3个主成分,累积贡献率可达90%。 主成分Ci表达式: SPSS软件不能直接给出主成分系数wij,经过FACTOR 过程产生的是因子负荷系数,但主成分分析模型需要的不是因子载荷量而是特征向量,所以还需将因子负荷系数输入数据编辑窗口,利用 “主成分相应特征根的平方根与特征向量乘积为因子负荷系数”的性质用TRANSFORM——COMPUTE 来计算特征向量,得到主成分的线性表达式。 因子负荷系数转换为主成分系数(特征向量) 特征向量: ? Prin1 Prin2 Prin3 Prin4 Prin5 Prin6 x1 0.522386 -.195138 -.190578 -.254711 0.215943 0.735666 x2 0.525457 -.081135 -.166475 -.388958 0.312044 -.664032 x3 0.511104 -.181008 -.104639 0.336278 -.756343 -.099605 x4 0.346489 -.046300 0.741022 0.456317 0.346929 -.010197 x5 0.188379 0.656718 -.471355 0.496310 0.253952 0.015620 x6 0.185038 0.699394 0.392082 -.464976 -.314787 0.087106 主成分的应用 一、主成分综合评价 医学研究中常常需要对患者的健康状况等进行评价,而这类评价要求内容全面,多个测量指标,最后产出综合评价结果。将多个指标进行综合总会面临以下问题: 1. 各指标量纲不同,不能直接相加; 2. 各指标间存在相关,直接相加产生信息重叠; 3.相加时需要考虑各指标的权重。 主成分分析可方便解决以上问题。 例3. 为评价31个地区的生殖健康状况,某研究者考察了此31个地区的4个有关生殖健康指标的得分,这4个指标的得分均是越高越好,它们各自反映了生殖健康的一个方面。对这31个地区进行综合评价。 特征向量: ? Prin1 Prin2 Prin3 Prin4 x1 0.499296 -.380737 0.775941 0.060475 x2 0.518859 -.132563 -.338619 -.773660 x3 0.510915 -.290727 -.519729 0.619940 x4 0.469526 0.867724 0.114601 0.116050 第一主成分贡献率达到82.66%,考虑只以第一主成分作为综合评价指标。 C1=0.4993X1+0.5189X2+0.5109X3+0.4695X 4 这里Xj为标准化值。 根据上述主成分得分计算公式,可得出31个地区各自的主成分得分。 根据得分的大小顺序可将这些地区分组。如需分为4个组,则可取第25分位数、中位数、第75分位数为分界点。分值最高的25%为生殖健康较优组。 二、主成分回归 当自变量间存在明显共线性时,回归方程的结果可能出现重大问题,以致无法解释。 主成分之间相关性为零,可解决原变量的共线性问题。 主成分回归指用原变量的主成分代替原自变量作回归分析。 主成分回归的步骤 1.求自变量的主成分; 2. 舍去贡献率近于0的主成分; 3.将留下的主成分代替原变量,建立与应变量的回归方程; 4.将主成分的表达式代入回归方程,得到原自变量与应变量的回归方程。 例4. 有22例胎儿受精龄(Y,周)与胎儿外形测量指标:身高(X1,cm),头围(X2,cm),体重 (X3,g)的数据。试求由X1,X2,X3推算Y的回归方程。 用原始资料建立回归方程,得: y^=11.0117+1.6927x1-2.1589x2+0.0075x3 这里x2的系数为负,意为头围与胎儿周龄成负相关,与实际情况不符。原因是3个自变量之间相关性较强: 最大条件指数=λ1/λ3=1184.7, 说明x1-x3存在严重共线性。 进行主成分分析,得到特征值和特征向量: λ1=2.9261, l1=( 0.58057 0.58107 0.57034) λ2=0.0714, l2=(- 0.41852 -0.38789 0.82121) λ3=0.00247, l3=( 0.69841 -0.71547 0.01799) 根据特征向量计算出主成分C1和C2,取这两个主成分与y作回归 C1=0.58057X1+0.58107X2+0.57034X3 C2= - 0.41852 X1+ -0.38789 X2+ 0.82121 X3 其中,Xi是原始变
文档评论(0)