02多元统计基础论述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元统计基础;;协方差(Covariance);若X和Y是独立的,协方差Cov(X,Y)将为0,反之不一定成立 如果X是p维多元变量X=(X1,X2,...,Xp),则所有元素的协方差可写为矩阵形式,即协方差矩阵 ;各协方差经验形式: 对于小样本,如n≤20,通常用1/(n-1) 对于p维随机变量,可得经验协方差矩阵: ;;时期;X1的均值为172.7,X2的均值为104.6,则 sX1X1=[(230-172.7)2+(181-172.7)2+...+(170-172.7)2]/10=1037.2 sX1X2=[(230-172.7)×(125-104.6)+(181-172.7)×(99-104.6)+...+(170-172.7)×(125-104.6)]/10=-80.2 ;样本协方差矩阵;相关系数(Correlation);相关系数的经验形式: 相关系数矩阵:;蓝套衫例子中样本相关系数矩阵:;协方差阵和相关系数矩阵的关系 设标准离差阵为 则有;多元正态分布;若p维随机向量X=(X1,X2,...,Xp)的密度函数为: x=(x1,x2,...,xp),μ是p维列向量,Σ是协方差矩阵,称X服从p元正态分布,记为X~Np(μ,Σ);当p=2时,设X=(X1,X2)服从二元正态分布,则 ;多元正态变量的基本性质 1.若Σ是对角阵,则随机向量中各变量相互独立 2.AX+b~N(Aμ+b,AΣA) 3. 多元正态分布子向量仍服从正态分布,但反过来则不一定 ;判断已有一批数据来自正态总体是很困难的,但判断数据不是来自正态总体则相对容易 把每个分量的值做成直方图,若不是正态分布,则随机向量一定不是正态分布;条件分布 给定X(2)时X(1)的条件分布仍服从正态分布 ;定理: 设X=(X1,X2,...,Xp)~Np(μ,Σ),Σ0,则X(1)|X(2)~Np(μ1.2,Σ11.2), 其中, μ1.2=μ(1)+Σ12Σ22-1(X(2)-μ(2)), Σ11.2=Σ11-Σ12Σ22-1Σ21 当Σ12=0,Σ11=Σ11.2;当Σ11=0,等价于X(1)和X(2)相互独立;定理 设 则 其中, ;例:在订制服装标准时需抽样进行人体测量,对某年龄段女子的测量结果如下:X1为身高,X2为胸围,X3为腰围,X4为上体长,X5为臀围,已知X服从多元正态分布,且有;若取X(1)=(X1,X2,X3),X(2)=X4,X(3)=X5 则,;这说明,若已知一个人的上身长和臀围,则身高、胸围、腰围的条件方差比原来的方差大大缩小;假设蓝套衫中,X1销量,X2价格,X3广告和X4时间都是正态分布, 给定X2,X3,X4,则X1的条件分布为单变量正态分布并具有均值 ;当给定X3,X4时,X1,X2的条件分布为双变量正态分布,具有均值 协方差矩阵 ;利用条件协方差阵可以求出Xi和Xj的偏相关系数 定义 若X(2)给定时,Xi和Xj的偏相关系数为: ;对蓝套衫数据有: 固定广告和销售助理不变,价格和销量之间的负相关系数比边际情况更显著 ;多元正态分布的参数估计 假定研究对象服从多元正态分布,但分布中的参数μ和Σ往往未知,需要通过样本指标对总体的参数进行估计 多元样本,从多元总体中随机抽取n个个体,若相互独立,且与总体同分布,则称为该总体的一个多元随机样本 每个个体称为一个样品,每个样品都是p维向量;多元样本中的每个样品,对p个指标的观测值往往是有相关关系的,但不同样品之间的观测值一定是相互独立的 多元分析所处理的多元样本观测数据一般都属于横截面数据,即同一时间不同空间上的数据;多元样本的数字特征 设 样本均值向量 样本离差阵 样本协差阵 ;μ和Σ的极大似然估计及基本性质 设有n个来自正态总体的样本,每个样品有p个观察指标,用极大似然法求出μ和Σ的估计量分别为: 为无偏、有效估计,和S/n一起为一致估计;样本均值向量分布 1.正态总体 2.非正态总体 中心极限定理,当样本容量n很大,且n相对于p也很大时,样本平均数近似于正态分布;样本离差阵S的分布 1928年统计学家Wishart 设 分别来自协方差阵相等的p维正态总体 则p×p维随机向量矩阵 的分布服从非中心Wishart分布,记为 ;其中, μa为非中心参数,当其为0时,称为中心Wishart分布,记为Wp(n,Σ) 当p=1时Σ=δ2,此时有W1(n,δ2)=δ2×卡方(n),可见,Wishart分布是卡方分布在p维中的推广 Wishart分

文档评论(0)

a336661148 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档