网站大量收购独家精品文档,联系QQ:2885784924

02 多元统计基础.ppt

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
在m2=2时, ∧近似为 F(2p,2(m1-p+1)) 为了了解三种差异究竟是由哪些商品引起的,对这四种商品做一元方差分析进行检验 协方差阵的检验 总体协方差检验判别总体均值的波动幅度是否显著 检验Σ=Σ0 n个来自p元正态分布的总体的样本, Korin导出L的极限分布和近似分布,并对小的n算出了表,当p≤10,n≤75 当p10,n75时,L近似于bF(f1,f2) 其中, 检验Σ1=Σ2=...=Σk 设有k个p元正态分布总体,Np(μ1,Σ1),...,Np(μk,Σk),第k个样本总体为 全部样本单位数n=n1+n2+...+nk 统计量为: 当k,p,n不大且n1=n2=...=nk=n0时,查M的分位点 若k,p,n较大时,M近似服从bF(f1,f2) 其中 多元正态分布的参数估计 假定研究对象服从多元正态分布,但分布中的参数μ和Σ往往未知,需要通过样本指标对总体的参数进行估计 多元样本,从多元总体中随机抽取n个个体,若相互独立,且与总体同分布,则称为该总体的一个多元随机样本 每个个体称为一个样品,每个样品都是p维向量 多元样本中的每个样品,对p个指标的观测值往往是有相关关系的,但不同样品之间的观测值一定是相互独立的 多元分析所处理的多元样本观测数据一般都属于横截面数据,即同一时间不同空间上的数据 多元样本的数字特征 设 样本均值向量 样本离差阵 样本协差阵 μ和Σ的极大似然估计及基本性质 设有n个来自正态总体的样本,每个样品有p个观察指标,用极大似然法求出μ和Σ的估计量分别为: 为无偏、有效估计,和S/n一起为一致估计 样本均值向量分布 1.正态总体 2.非正态总体 中心极限定理,当样本容量n很大,且n相对于p也很大时,样本平均数近似于正态分布 样本离差阵S的分布 1928年统计学家Wishart 设 分别来自协方差阵相等的p维正态总体 则p×p维随机向量矩阵 的分布服从非中心Wishart分布,记为 其中, μa为非中心参数,当其为0时,称为中心Wishart分布,记为Wp(n,Σ) 当p=1时Σ=δ2,此时有W1(n,δ2)=δ2×卡方(n),可见,Wishart分布是卡方分布在p维中的推广 Wishart分布基本性质: 1 样本离差阵 2 若 ,且相互独立,则 3 若 , Cp×p为非奇异矩阵,则 多元正态总体的假设检验 在样本容量一定条件下,同时减少两类错误是不可能的 Neyman和E.Pearson提出一个原则,在控制犯第一类错误概率条件下,尽量使犯第二类错误的概率小,则原假设受到保护,不至于被轻易拒绝。一旦拒绝原假设则表明拒绝理由充分,如果接受则接受理由还不充分 只对第一类错误加以控制,而不关注第二类错误的假设检验称为显著性检验,犯第一类错误的概率称为显著性水平 单个多元正态总体均值向量的检验 1总体协方差Σ已知时, ,当 拒绝H0 2 总体协方差阵未知时 统计量T2是由多元统计先驱Hotelling提出的,通常称该统计量为HotellingT2统计量 p=1时,T2=t2,是t分布的多元推广 在显著性水平α下,若 则拒绝H0 霍特林(Hotelling)T2分布 定义:设X~Np(μ,Σ),S~Wp(n,Σ),且X与S相互独立,n≥p,则统计量T2=nXTS-1X的分布为非中心霍特林T2分布,记为T2~T2(p,n,μ) 当μ=0时,称T2服从中心霍特林T2分布,记为T2~T2(p,n) 在一元统计中,若X1,X2,...,Xn来自总体N(μ,δ2)的样本,则统计量 把t平方有: 1.协方差矩阵Σ已知,均值向量的检验 H0:μ=μ0,H1:μ≠μ1 H0成立时,统计量 给定显著水平,查卡方分布表,按照 确定临界值 再由样本计算出T2值,若大于临界值,则拒绝H0,否则接受H1 2 协方差矩阵未知时,均值向量的检验 给定显著性水平,查F表,使得P{FFα},确定临界值Fα;再由样本计算出F,若大于临界值,则拒绝H0,否则接受H1 例:对20名健康女性的汗液进行分析,测出汗液的三种成分:X1排汗量,X2钠含量,X3钾含量 数据如下: 序号 X1 X

您可能关注的文档

文档评论(0)

糖糖 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档