- 15
- 0
- 约9.08千字
- 约 29页
- 2017-06-08 发布于重庆
- 举报
13 多维数据的数字特征及相关分析
2017-6-8
1
复习 1.2 数据的分布
2017-6-8
2
1.3 多维数据的数字特征及相关分析
基本内容
二维总体数字特征
观测数据协方差Pearson相关系数
Spearman相关系数
SAS系统 corr过程
p维总体数字特征 相关系数矩阵
随机向量的性质
多维正态分布
观测数据协方差
Pearson相关矩阵
Spearman相关矩阵
proc corr过程
1.3.1 二维数据的数字特征及相关系数
1.3.3 多维数据的数字特征及相关矩阵
1.3.2 多维总体的数字特征、相关矩阵及多维正态分布
2017-6-8
3
一. 二维数据的数字特征及相关系数
总体(X,Y)T分布函数F(x,y) ,方差 Var(X), Var(Y), 协方差Cov(X,Y),
相关系数
1.3.1 二维数据的数字特征
——称不相关
2017-6-8
4
当X与Y相互独立时,
二维数字特征的性质
(3)
2017-6-8
5
二.观测数据的协方差、Pearson相关系数
总体(X,Y)T,观测数据
,
1.观测数据的协方差
——观测矩阵
——样本方差、协方差
——均值
,
2017-6-8
6
由Schwarz不等式知
注意:
散点图见书图1.11
——协方差矩阵,为对称非负定
2.观测数据的Pearson相关系数
——Pearson相关系数
(Schwaraz不等式)
2017-6-8
7
可证,当(X,Y)T 为二维正态
3.二维随机变量相关性检验
n充分大时
观测数据
假设检验
统计量
如|t|过大,拒绝假设,认为X与Y相关.拒绝域
检验p值
2017-6-8
8
1.秩统计量
三.Spearman相关系数
总体X,观测值
定义:秩统计量
观测值 -0.8, -3.1, 1.1, -5.2 4.2
次序统计量 -5.2, -3.1, -0.8, 1.1, 4.2
如
-0.8,-3.1,-0.8
秩统计量
2, 1, 3
或 3, 1, 2
记为 2.5 1, 2.5
秩统计量 3, 2, 4, 1, 5
次序统计量
注意:为保证秩统计量唯一性,规定:
相同观测值,秩统计量取应排序的平均值。
2017-6-8
9
分量X,Y的一元样本数据
当X,Y相关性较强,则两组秩统计量相关性也较强
2.Spearman相关系数
总体(X,Y)T,观测数据
秩统计量分别是
定义: Spearman相关系数
其中
计算得
2017-6-8
10
基于Spearman相关系数的假设检验
统计量
给定 ,当 ,拒绝H0.否则, 接受H0认为不相关.
检验P值
四.SAS系统 proc corr过程
2017-6-8
11
例1.9
20个随机选取的黄麻个体植株,记录青植株重量Y与干植株重量X . 设(X,Y)T服从正态分布,数据:
(1)求二维观测数据均值向量 和协方差矩阵;
(2)计算Pearson相关系数并检验假设;
解:
(3)计算Spearman相关系数并检验上述假设.
x 68 63 70 6 65 9 10 12 20 30 33 27 21 5 14 27 17 53 62 65
y 971 892 1125 82 931 112 163 321 315 375 462 352 305 84 229
332 185 703 872 740
data examp1_9;
input x y @@;
cards;
68 971 63 892 70 1125 6 82 65 931 9 112 10 162 12 321 20 315 30 375 33 462 27 352 21 305 5 84 14 229 27 332 17 185 53 703 62 872 65 740
;
run;
proc corr data=examp1_9 pearson spearman cov;
/*方差描述性过程,输出Pearson Spearman相关矩阵,协方差阵*/
run;
2017-6-8
12
例1.9结果输出 C
原创力文档

文档评论(0)