多元分析报告常用统计量与均向量统计推断.docVIP

多元分析报告常用统计量与均向量统计推断.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元分析报告常用统计量与均向量统计推断

多元统计分析方法 一、多元分析常用统计量 例1.1 调查某地16岁中学生12名,其身高、体重和胸围资料见下表。 表1.1 12名16岁中学生身高、体重和胸围测量资料 编号 身高(cm) 体重(kg) 胸围(cm) 1 171.0 58.5 81.0 2 175.0 65.0 87.0 3 159.0 38.0 71.0 4 155.3 45.0 74.0 5 152.0 35.0 63.0 6 158.3 44.5 75.0 7 154.8 44.5 74.0 8 164.0 51.0 72.0 9 165.2 55.0 79.0 10 164.5 46.0 71.0 11 159.1 48.0 72.5 12 164.2 46.5 73.0 单变量时,对每个变量分别计算和。 多变量时,则计算每个变量的均数、方差以及变量间的协方差。 为了清晰表达多变量间的关系,常用矩阵(matrix)表示。构成矩阵的每个数据称为元素(element)。这里称为均向量、方差协方差矩阵。 1. 均向量(means vector) 将各变量的均数用矩阵形式排列,称为均向量。如本例均向量为三维列向量: 其转置向量为三维行向量: 更一般地: 观测对象 1 2 n 则样本均向量为: 2. 方差协方差矩阵(简称协方差矩阵或协差阵) 本例:第1个变量方差为: 本例共三个方差 第1个变量与第2个变量的协方差为: 本例共三个协方差。 为了全面反映这三个变量本身的变异和三个变量间的协变异,可将其方差和协方差用矩阵形式排列,称方差协方差矩阵,简称协差阵。记为V(See P.2)。 显然,。即协差阵为对称阵。常给出矩阵的左下半,称为下三角阵。 一般地,如n个观察单位测量了m个变量,则样本协差阵为维的对称阵。记为: 其中:对角线上为各变量的方差: , 对角线两侧为变量间的协方差: , 可见,方差为协方差的特例,或协方差为更一般的形式。 3. 离均差平方和与离均差积和矩阵(离差阵) 将各变量的离均差平方和与离均差积和用矩阵排列,该矩阵称为离差阵(SSCP)。用SS或L表示。 与V的关系为: 或 4. 相关系数矩阵(相关阵) 与的相关系数为: 变量本身的相关系数为1,因此: 将各变量间的相关系数用矩阵形式排列,称相关阵。记为R(See P.3)。 一般地,n个观察对象有m个变量,则有维的样本相关阵: 其中: 如事先对每个变量做标准化变换,则变换后变量的协差阵等于原变量的相关阵。 5. 总体均向量与协差阵 用 ( 表示总体均向量,记为 用∑表示总体协差阵,维的总体协差阵记为 其中,为第i个变量的总体方差,为第i个变量与第k个变量的总体协方差。 二、均向量的统计推断 1. 多元T检验(Hotelling检验) (1) Student-t检验的简单回顾 ① 检验一样本是否来自某已知总体 设有某正态总体N,现有一大小为n的样本,其均数和标准差分别为和S。是总体均数的估计值。问此样本是否来自均数为的总体? ,检验水准为α t服从于自由度为n -1的t分布。,在α水准拒绝;,在α水准上不拒绝。 在成立的条件下,,也可根据F分布作出统计推断。此时,。 ② 检验两样本是否来自同一总体 设两样本来自两个具有公共方差的总体和 ,两样本有关指标分别为和。 ,检验水准为α t服从于自由度为的t分布。 如,在α水准上拒绝; 如,在α水准上不拒绝。 在成立的条件下,,此时, 在许多医学问题中,做假设检验时(如检验两样本是否来自同一总体时)所依据的指标可能不只一个。例如: 儿童生长发育:身高、体重、头围、胸围 血压: 收缩压、舒张压 甲状腺功能: 血脂: 总胆固醇、甘油三酯 风湿或类风湿: 血沉、抗“O”、WBC计数 编号 血沉() 抗“O”() WBC() 风湿: 1 2 类风湿: 1 2 若仍用t检验,有几个问题: (1) 重复进行t检验,增加犯I型错误的概率。 (2) 忽略了变量间的相互联系。 (3) t检验结果不一致时,难以下一个综合结论。 例如,本例只有出现下列情况之一,才可作出明确判断: ① 两组间的差别均有统计学意义,且大小趋势一致(三项指标都是值越大,病情越差); ② 两组间各指标的差别均无统计学意义。 反之,出现下列情况之一,则难以得出明确结论: ① 两组间各指标的差别具有统计学意

文档评论(0)

phltaotao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档