- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析与因子分析-医学统计教学课件PPT
主 成 分 分 析
与 因 子 分 析;讲课内容:
第一节 主成分分析
第二节 因子分析;第一节
主成分分析
Principal Components Analysis;一、基本思想
数据的降维、数据的解释
将原来众多具有一定相关性的指标,组
合成一组新的相互无关的综合指标。
从中选取几个较少的综合指标尽可能多
的反映原来众多指标的信息。
这种既减少了指标的数目又抓住了主要矛
盾的做法有利于问题的分析和处理。;;二、数学模型及几何意义;Z = A X;第一主成分;第二主成分;X1;X1;Z1;三、主成分的求法及性质;(一)主成分的求法
1. 对各原始指标值进行标准化;标准化后的数据矩阵;2. 求出X1 , X2 , … , Xm 的相关矩阵R;Pearson 相关系数 ;3. 求出矩阵R的全部特征值(eigenvalue) ?i,
第i个主成分的组合系数ai1, ai2, ?, aim满
足方程组:
(r11- ?i) ai1+ r12 ai2+ ?+ r1m aim =0
r21 ai1+ (r22- ?i) ai2+ ?+ r2m aim=0
?
rm1 ai1+ rm2 ai2+ ?+ (rmm- ?i) aim =0
; (r11- ?i) ai1+ r12 ai2+ ?+ r1m aim =0
r21 ai1+ (r22- ?i) ai2+ ?+ r2m aim=0
?
rm1 ai1+ rm2 ai2+ ?+ (rmm- ?i) aim =0 ;4. 由以上方程组,求出相应于特征值 ?i 的
特征向量(eigenvector)
(ai1 , ai2 , ? , aim)’;(二)主成分的性质
1.各主成分互不相关 ;2.主成分的贡献率与累积贡献率
(原始指标值标准化);3.主成分个数的选取
(1)前k个主成分的累积贡献率70%。
(2)主成分Zi的特征值?i ≥ 1。;5.样品的主成分得分;四、实例;;;; 1.主成分个数的选取
?3很接近于1;
?3 与?2的贡献率相差不大,为25%左右,
若舍去?3不合理。
取前三个主成分。;2.列出主成分表达式;3.求出因子载荷阵;4.主成分得分;标准化指标主成分还原为原始指标主成分; 将该肝病患者的四项肝功能指标代入
原始指标主成分表达式:
Z1=2.50865
Z2=-1.06626
Z3=-1.22943
该肝病患者可能为急性炎症。;五、主成分分析的应用
1.对原始指标进行综合
以互不相关的较少个综合指标反应众多原
始指标提供的信息。
主成分回归(解决多元共线问题)。 ;3.进行探索性分析
利用因子载荷阵,找出影响各综合指标的
主要原始指标。
4.对样品进行分类
利用主成分得分对样品进行分类:
Z1为急性炎症成分
Z2为慢性炎症成分
Z3为癌变成分;第二节
因子分析
Factor Analysis;一、因子分析基本思想
从分析多个可观测的原始指标的相关关系入手,找到支配这种相关关系的有限个不可
观测的潜在变量。是多元分析中处理降维的
一种统计方法。;二、因子分析数学模型 ; specific factor;Xi:观测指标(标准化数据)
Fi:公因子 ei:特殊因子
aij:因子载荷(计算关键项);X = AF + e;;;三、因子模型的性质
矩阵A的统计意义
1.公共度(共性方差 );因子的共性方差;2.因子贡献与因子贡献率
矩阵A第j列元素 反映了第j个公
因子Fj对所有原始指标的影响;
数据标准化后全部原始指标的总方差为指
标个数m。;各因子的贡献;3.因子载荷及因子载荷阵;;2.对各指标进行标准化
3.求指标间的相关系数矩阵RX
4.求指标间的约相关系数矩阵R*
(1)R*的非对角线元素与相关矩阵RX的
非对角线元素相等
(2)R*的对角线元素为共性方差;5. 求出约关系数矩阵R*所有大于零的特
征值及相应的特征向量
6. 写出因子载荷阵A,得出原始指标X的
公因子表达式;要求:
1. 保留公因子个数q小于指标个数m,原则:
?j≥1
您可能关注的文档
最近下载
- 2024年中级社工法规四色讲义-完整版全189页 .pdf VIP
- 17K408:散热器选用与管道安装.docx VIP
- 2025年湖北省武汉市高考物理四调试卷+答案解析(附后) .pdf VIP
- 合信 COTRUST科创思CTSC-200系列用户手册V1.40.pdf
- 2012湖南公务员考试-公共基础知识.doc VIP
- 二年级语文教师家长会专用.ppt
- 杭州名鑫双氧水有限公司每年10万吨(折27.5%)过氧化氢技术改造项目可行性研究报告.doc
- DB14Z 1-2025 高速公路智慧服务区建设指南.docx
- [城市轨道交通地下段列车运行引起的住宅室内振动与结构噪声限值及测量方法上海市.doc VIP
- SR变更管理程序+变更全套表单 OK.doc
文档评论(0)