13 多维数据的数字特征及相关分析.pptxVIP

  • 15
  • 0
  • 约9.08千字
  • 约 29页
  • 2017-06-08 发布于重庆
  • 举报
13 多维数据的数字特征及相关分析

2017-6-8 1 复习 1.2 数据的分布 2017-6-8 2 1.3 多维数据的数字特征及相关分析 基本内容 二维总体数字特征 观测数据协方差Pearson相关系数 Spearman相关系数 SAS系统 corr过程 p维总体数字特征 相关系数矩阵 随机向量的性质 多维正态分布 观测数据协方差 Pearson相关矩阵 Spearman相关矩阵 proc corr过程 1.3.1 二维数据的数字特征及相关系数 1.3.3 多维数据的数字特征及相关矩阵 1.3.2 多维总体的数字特征、相关矩阵及多维正态分布 2017-6-8 3 一. 二维数据的数字特征及相关系数 总体(X,Y)T分布函数F(x,y) ,方差 Var(X), Var(Y), 协方差Cov(X,Y), 相关系数 1.3.1 二维数据的数字特征 ——称不相关 2017-6-8 4 当X与Y相互独立时, 二维数字特征的性质 (3) 2017-6-8 5 二.观测数据的协方差、Pearson相关系数 总体(X,Y)T,观测数据 , 1.观测数据的协方差 ——观测矩阵 ——样本方差、协方差 ——均值 , 2017-6-8 6 由Schwarz不等式知 注意: 散点图见书图1.11 ——协方差矩阵,为对称非负定 2.观测数据的Pearson相关系数 ——Pearson相关系数 (Schwaraz不等式) 2017-6-8 7 可证,当(X,Y)T 为二维正态 3.二维随机变量相关性检验 n充分大时 观测数据 假设检验 统计量 如|t|过大,拒绝假设,认为X与Y相关.拒绝域 检验p值 2017-6-8 8 1.秩统计量 三.Spearman相关系数 总体X,观测值 定义:秩统计量 观测值 -0.8, -3.1, 1.1, -5.2 4.2 次序统计量 -5.2, -3.1, -0.8, 1.1, 4.2 如 -0.8,-3.1,-0.8 秩统计量 2, 1, 3 或 3, 1, 2 记为 2.5 1, 2.5 秩统计量 3, 2, 4, 1, 5 次序统计量 注意:为保证秩统计量唯一性,规定: 相同观测值,秩统计量取应排序的平均值。 2017-6-8 9 分量X,Y的一元样本数据 当X,Y相关性较强,则两组秩统计量相关性也较强 2.Spearman相关系数 总体(X,Y)T,观测数据 秩统计量分别是 定义: Spearman相关系数 其中 计算得 2017-6-8 10 基于Spearman相关系数的假设检验 统计量 给定 ,当 ,拒绝H0.否则, 接受H0认为不相关. 检验P值 四.SAS系统 proc corr过程 2017-6-8 11 例1.9 20个随机选取的黄麻个体植株,记录青植株重量Y与干植株重量X . 设(X,Y)T服从正态分布,数据: (1)求二维观测数据均值向量 和协方差矩阵; (2)计算Pearson相关系数并检验假设; 解: (3)计算Spearman相关系数并检验上述假设. x 68 63 70 6 65 9 10 12 20 30 33 27 21 5 14 27 17 53 62 65 y 971 892 1125 82 931 112 163 321 315 375 462 352 305 84 229 332 185 703 872 740 data examp1_9; input x y @@; cards; 68 971 63 892 70 1125 6 82 65 931 9 112 10 162 12 321 20 315 30 375 33 462 27 352 21 305 5 84 14 229 27 332 17 185 53 703 62 872 65 740 ; run; proc corr data=examp1_9 pearson spearman cov; /*方差描述性过程,输出Pearson Spearman相关矩阵,协方差阵*/ run; 2017-6-8 12 例1.9结果输出 C

文档评论(0)

1亿VIP精品文档

相关文档