- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[理学]本人根据方积乾老师讲课内容整理的多元统计分析课件4
生物医学研究的统计方法 主成分分析 Principal Component Analysis 预备知识—定量变量的特征数 定量地描述集中趋势与离散趋势是统计描述的重要内容. 一、 描述集中趋势的统计指标 对于连续型定量变量,描述集中趋势常用的统计量为算术均数、几何均数和中位数。 多个指标的问题: 1、指标与指标可能存在相关关系 信息重叠,分析偏误 2、指标太多,增加问题的复杂性和分析难度 如何避免? Hotelling(1939)用两个主成分反映学生的入学成绩: 文科能力 数理能力 预备知识: 1:方差为零的变量不能区分总体的个体成员。 2:可用一个变量的方差来度量其所传递的信息量。 主成分分析的基本思想 一个假设的例子:N=100 X1 X2 均数 101.63 50.71 方差 109.63 55.40 标准差 10.47 7.44 主成分分析的基本思想 主成分分析的基本思想 (1)创建C1 使得VarC1尽可能大,即寻找一个方向使所有点在此方向上的投影的方差尽可能大 VarC1=147.44 (2)创建C2 C2和C1不相关,使得VarC2尽可能大,即寻找一个与C1垂直的方向使所有点在此方向上的投影的方差尽可能大 主成分分析的基本思想 如何综合多个随机变量? 我们想要一个或多个综合变量,概括6个形态的大部分信息 注意:某指标在人群中方差较大,它就是一个好的指标。 寻找综合变量 x1,x2,…x6为 6 维随机变量 X1,X2,…,X6的标准化变换 (1)寻找第一主成分C1,寻找6个系数得 满足 则C1为第一主成分。 (2)寻找第二主成分 找到适合的6个系数 满足 则C2为第二主成分。 类似地,共可得到至多 6 个独立的主成分。 主成分分析的基本思想 假设有p个原始变量,寻找一系列新变量 将原始变量标准化 主成分分析的基本思想 寻找新变量C1,要求: 新变量是原始变量的线性组合, 且 新变量的方差Var(C1)最大。 主成分分析的基本思想 寻找新变量C2,要求: 新变量是原始变量的线性组合, 且 新变量C2与C1无关, Corr(C1,C2)=0 新变量的方差Var(C2)最大。 主成分分析的基本思想 以此类推寻找新变量C3,C4,…,Cp,最多可有p个新变量 主成分的基本思想 定义C1为第一主成分; 定义C2为第二主成分; 依次类推。 主成分的性质 主成分 C1,C2,…,Cp 具有以下性质: (1)主成分间互不相关Corr(Ci,Cj)=0 i ? j (2) 组合系数(ai1,ai2,…,aip)构成的向量为单位向量 (3)各主成分的方差是依次递减的, 即 Var(C1)≥Var(C2)≥…≥Var(Cp) (4) 总方差不增不减, 即 Var(C1)+Var(C2)+ … +Var(Cp) =Var(x1)+Var(x2)+ … +Var(xp) =p 协方差矩阵 样本的方差-协方差矩阵(variance-covariance matrix) 如果有p个观测变量 , 则样本的协方差矩阵记为 相关矩阵 如果有p个观测变量 ,其相关阵(correlation matrix)记为 矩阵的特征值和特征向量 对于方阵A,如存在常数λ及非零向量x,使 Ax= λx 则λ为A的一个特征值,x为与λ对应的矩阵A的特征向量。 n介方阵有n对特征值和特征向量 正交向量(阵)、单位向量 正交向量: a=(a1,…,ap)’, b=(b1,…,bp)’ 如果a’b=a1b1+…+apbp=0,则称a、b正交 单位向量:向量a=(a1,…,ap)’,如果 则称a为单位向量 正交阵:n阶方阵A,如果 AA’=A’A=I,则称A为n阶正交
文档评论(0)