- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
演示文稿演讲PPT学习教学课件医学文件教学培训课件
主 成 分 分 析
与 因 子 分 析;讲课内容:
第一节 主成分分析
第二节 因子分析;第一节
主成分分析
Principal Components Analysis;一、基本思想
数据的降维、数据的解释
将原来众多具有一定相关性的指标,组
合成一组新的相互无关的综合指标。
从中选取几个较少的综合指标尽可能多
的反映原来众多指标的信息。
这种既减少了指标的数目又抓住了主要矛
盾的做法有利于问题的分析和处理。;; 如何利用这些指标对每一儿童的生长发育
作出正确评价?
仅用单一指标:
结论片面;
没有充分利用原有数据信息。
利用所有指标:
各指标评价的结论可能不一致,使综合
评价困难;
工作量大。;
找出几个综合指标(长度、围度、特体),这些综合指标是原始指标的线性组合,既保留了原始指标的信息,且互不相关。
各综合指标提供的“信息”量大小用其方差来衡量。
衡量一个指标的好坏除了正确性与精确性外,还必须能充分反映个体间的变异,一
项指标在个体间的变异越大,提供的信息
量越多。;二、数学模型及几何意义;Z = A X;第一主成分;Z1;三、主成分的求法及性质;(一)主成分的求法
1. 对各原始指标值进行标准化;标准化后的数据矩阵;2. 求出X1 , X2 , … , Xm 的相关矩阵R;Pearson 相关系数 ;3. 求出矩阵R的全部特征值(eigenvalue) ?i,
第i个主成分的组合系数ai1, ai2, ?, aim满
足方程组:
(r11- ?i) ai1+ r12 ai2+ ?+ r1m aim =0
r21 ai1+ (r22- ?i) ai2+ ?+ r2m aim=0
?
rm1 ai1+ rm2 ai2+ ?+ (rmm- ?i) aim =0
; (r11- ?i) ai1+ r12 ai2+ ?+ r1m aim =0
r21 ai1+ (r22- ?i) ai2+ ?+ r2m aim=0
?
rm1 ai1+ rm2 ai2+ ?+ (rmm- ?i) aim =0 ;4. 由以上方程组,求出相应于特征值 ?i 的
特征向量(eigenvector)
(ai1 , ai2 , ? , aim)’;(二)主成分的性质
1.各主成分互不相关 ;2.主成分的贡献率与累积贡献率
(原始指标值标准化);3.主成分个数的选取
(1)前k个主成分的累积贡献率70%。
(2)主成分Zi的特征值?i ≥ 1。;5.样品的主成分得分;四、实例;;;; 1.主成分个数的选取
?3很接近于1;
?3 与?2的贡献率相差不大,为25%左右,
若舍去?3不合理。
取前三个主成分。;2.列出主成分表达式;3.求出因子载荷阵;4.主成分得分;标准化指标主成分还原为原始指标主成分; 将该肝病患者的四项肝功能指标代入
原始指标主成分表达式:
Z1=2.50865
Z2=-1.06626
Z3=-1.22943
该肝病患者可能为急性炎症。;五、主成分分析的应用
1.对原始指标进行综合
以互不相关的较少个综合指标反应众多原
始指标提供的信息。
主成分回归(解决多元共线问题)。 ;3.进行探索性分析
利用因子载荷阵,找出影响各综合指标的
主要原始指标。
4.对样品进行分类
利用主成分得分对样品进行分类:
Z1为急性炎症成分
Z2为慢性炎症成分
Z3为癌变成分;第二节
因子分析
Factor Analysis;一、因子分析基本思想
从分析多个可观测的原始指标的相关关系入手,找到支配这种相关关系的有限个不可
观测的潜在变量。是多元分析中处理降维的
一种统计方法。;二、因子分析数学模型 ; specific factor;Xi:观测指标(标准化数据)
Fi:公因子 ei:特殊因子
aij:因子载荷(计算关键项);X = AF + e;;;三、因子模型的性质
矩阵A的统计意义
1.公共度(共性方差 );因子的共性方差;2.因子贡献与因子贡献率
矩阵A第j列元素 反映了第j个公
因子Fj对所有原始指标的影响;
数据标准化后全部原始指标的总方差为
文档评论(0)