- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
应用多元统计分析 第七章、主成分分析第5讲、主成分分析的应用
设n次观测数据阵X已标准化,这时样本协方差阵就是样本相关阵R, R的特征值为λ1≥λ2 ≥ …≥λp 相应的标准化特征向量为a1,a2, …,ap 。样本主成分为 Zi=aiX (i=1,…,p). 设m为满足累计贡献率>P0(一般取1≥P0≥0.7 )的最小正整数,取前m个主成分Z1 ,Z2 ,… ,Zm,由样本观测数据X(i) (i=1,2,…n)可求得m个主成分的得分值zij :
利用样本主成分的性质(3),Xk由前m个主成分Z1 ,Z2 ,… ,Zm的最佳(残差平方和最小)表示式为把Z(i )(i=1,2,…,n)代入上式,可得
由此可得出由主成分得分值估计变量Xk的得分向量.记其中(7.3.2)
当选取合适的m,可使得后面的p-m个?i的和很小,这时就有其中可以证明
一、指标分类(变量分类) 如果第i个变量和第j个变量的相关系数rij≈1,显然这两个变量应归为一 类. 仍用Xi和Xj表示这两个变量的n次观测向量.考虑n维空间中这两点的距离:因 (n-1)R=X X=(X1,…, Xp ) (X1,…, Xp ), 故有 Xi Xj =(n-1) rij (i,j=1,…,p)
zi zi=(n-1) λi (i=1,2,…,p) zizj=0 (当i≠j 时 )
因第k个主成分Zk与原标准化变量Xi的相关系数为?ik也称为第k个主成分Zk对Xi的因子负荷量. 这时 2(1- rij)≈(?i1-?j1)2+…+ (?im-?jm)2 ,若rij≈1, 则有 (?i1-?j1)2+…+ (?im-?jm)2 ≈ 0 .
考察m维空间的p个点Qi,其坐标为 Qi=(?i1 ,?i2 ,...,?im ) (i=1,2,…,p) .按距离最近准则对p个点进行分类. 当m=2时,p个点可在平面上点出来,利用散布图可直观地给出指标的分类.
二、样品分类 对p个变量(指标)观测n次,得n个样品,记 X(i) =(xi1, xi2 ,…, xip)′为第i个样品,看成p维空间的点,可按距离相近的程度进行分类(参见第六章聚类分析),即若‖ X(i) - X(j)‖≈0,就把第i个样品和第j个样品归为一类.。 因原始数据阵X≈X*,故 ‖ X(i) - X(j)‖≈ ‖ X*(i) - X*(j)‖由(7.3.1)及(7.3.2)式中x*ik的定义知
因‖X*(i)-X*(j)‖2=‖a1(zi1- zj1)+…+am(zim- zjm )‖2 =(zi1- zj1)2 +…+(zim- zjm ) 2 注意:a1, a2,…, am,为单位正交向量.
这样就把考察二个p维空间点的靠近程度转化为考察两个m(mp)维空间点的靠近程度. 若取m=2,n个样品点可在平面上点出,利用点的分布规律对样品进行分类.三、样品排序或系统评估 对多指标系统进行排序评估的主要方法是加权评估法.比如专家评估方法,综合评分法,层次分析法等.随着多元统计方法的普及与应用,主成分分析方法也成为构造系统排序评估指数的常用方法之一. 设Z1是标准化随机向量X=(X1,…,Xp)′的第一主成分.由主成分的性质可知,Z1与原始标准化变量X1,X2,…,Xp的综合相关程度最强,
即ρ2(Z1,X1)+…+ρ2(Z1,Xp)= λ1达最大,其中λ1为X的相关阵R的最大特征值.如果只选一个综合变量来代表原来所有的原始变量,最佳的选择就是Z1 . 另方面,由于第一主成分Z1对应于数据变异最大的方向,这说明Z1是使数据信息损失最小,精度最高的一维综合变量,因此它可用于构造系统排序评估指数.
小结主成分分析的应用:1、变量的分类2、样品的分类3、样品的排序和评估
您可能关注的文档
- 多元统计分析多元统计分析 (41).ppt
- 多元统计分析多元统计分析 (43).ppt
- 多元统计分析多元统计分析 (44).ppt
- 多元统计分析多元统计分析 (45).ppt
- 多元统计分析多元统计分析 (46).ppt
- 多元统计分析多元统计分析 (47).ppt
- 多元统计分析多元统计分析 (48).ppt
- 复变函数与积分变换 (1).ppt
- 复变函数与积分变换 (2).ppt
- 复变函数与积分变换 (3).ppt
- 四川省德阳市罗江中学2025届高三考前热身化学试卷含解析.doc
- 山东省枣庄现代实验学校2025届高三下学期第五次调研考试化学试题含解析.doc
- 吉林省长春市十一高中等九校教育联盟2025届高三一诊考试生物试卷含解析.doc
- 2025届江苏省盐城市伍佑中学高考仿真模拟化学试卷含解析.doc
- 2025届广西贺州中学高考冲刺押题(最后一卷)生物试卷含解析.doc
- 安徽省池州市贵池区2025届高三第一次模拟考试生物试卷含解析.doc
- 宁夏银川一中2025届高三(最后冲刺)化学试卷含解析.doc
- 广东省广州市增城区四校联考2025届高考压轴卷化学试卷含解析.doc
- 2025届邯郸市第一中学高考生物必刷试卷含解析.doc
- 2025届安徽省安庆市石化第一中学高考仿真卷化学试卷含解析.doc
文档评论(0)