- 2
- 0
- 约1.77千字
- 约 26页
- 2017-02-11 发布于江苏
- 举报
§1.3 多维数据的数字特征、相关分析
除单维分析外, 重要的是分量之间的相关分析.
1. 二维观测数据的数字特征、相关系数
设是二维总体, 样本
(1) 观测矩阵:
(2) 二维观测数据均值向量
其中,;
(3) 观测数据的方差、协方差
,,
,
(4) 观测数据的协方差矩阵
(5) 观测数据的相关系数 ,
1’. 二维总体的数字特征、相关系数
(1) 的分布函数;
(2) 各自的方差;
(3) 总体协方差;
(4) 总体的相关系数;
数据的相关系数是总体的相关系数的相合估计,即
当时, 常有, 有失实意, 故需做
假设检验 .
已有结论: 当为二维正态且为真时, 则
,
值检验:
对于给定的, 若, 则拒, 即认相关.
Pearson相关系数: 即.
Spearman 相关系数 一种秩相关系数
数据的秩 在中的序号
例 样本数据: ,
次序统计量:
秩统计量的值:
例’ 样本数据: ,
次序统计量:
秩统计量值: 或 不惟一;
约定: 对于相同观测值, 同取各位置的平均值.
对例’, 秩统计量值: .
对于总体, 分别可得
关于的秩统计量: ;
关于的秩统计量: .
当相关性较强时,相应的秩统计量相关性也强
Spearman 相关系数
由秩的定义, 易得
经推算(略)得
,
Spearman相关系数也可用于检验假设
(后面介绍).
在SAS系统中, 过程proc corr可计算
1) 多维数据两两间的Pearson和Spearman相关系数
2) 各对变量间相关系数为0的检验值
3) 多维观测数据的均值向量、协方差矩阵
例1.9对于20个随机选取的黄麻个体植株,记录其青植株重量与它们的干植株重量,设服从二维正态分布,其观测数据如下表(略). 求
1) 均值向量, 协方差矩阵;
2) Pearson相关系数, 并检验假设;
3) Spearman相关系数,并检验假设.
解: 调用 proc corr过程得
1) ,
2) Pearson相关系数,
检验值 0.000 1,故与相关性是高度显著的
3) Spearman相关系数
检验值 0.000 1,与相关性也是高度显著的
2. 多维数据的数字特征及相关矩阵
1) 维总体
2) 个观测数据,
均值向量为;
3) 数据观测矩阵 ;
4) 观测数据的协方差矩阵
即.
5) 观测数据的Pearson相关矩阵
记
则有.
6) Spearman相关矩阵
7) 标准化数据处理
(标准化观测矩阵(
3. 总体的数字特征、相关矩阵、多维正态分布
设维总体,
1) 分布函数
2) 均值向量
3) 协方差阵
4) 相关矩阵
记
则 ..
4. 样本数据与总体的关系
先介绍随机向量的性质.
设,,则
1)
特别,
2)
特别
数据的分别是总体的的相合估计,
故当充分大时, 有.
数据的中位数向量
是总体的中位数向量的估计;
Spearman相关矩阵是的稳健估计(抗扰)
5. 多维正态
(1) 概率密度
其中:.
(2) 多维正态分布性质(证略)
1) 设,,则
2) 设, 分割后, 有
,
3) 设, 分割后,
与相互独立(
(3) 多维正态最大似然法估计
设是来自总体的样本,
则的联合概率密度为
最大似然估计:
满足的
结果为
例1.10 对20名中年人测量3个生理指标,3个训练指标, 观测数据见表1.2
(部分数据) 求
(1)观测数据的均值向量,协方差矩阵,Pearson相关矩阵
(2)观测数据的中位数向量,Spearman相关矩阵;
(3)分析各指标间的相关性.
解: (1) 调用proc corr过程, 得
(2) 调用proc corr过程, 得
(3) 若取显著水平, 则
由Pearsons相关矩阵, 得检验值的有
由Spearman相关矩阵, 得检验值的有
由此可知, 相应的变量对, 其相关性较小.
...
...
您可能关注的文档
最近下载
- 天语SX4电路图.pdf VIP
- AQ1029-2019 煤矿安全监控系统及检测仪器使用管理规范 (AQ 1029-2019).pdf VIP
- 山东省潍坊市高密市2024-2025学年四年级上学期期末数学试题.docx VIP
- GB_T 10125-2021人造气氛腐蚀试验 盐雾试验.docx VIP
- 锅炉水质化验记录.doc VIP
- 二年级数学上册期末考试试卷及答案.pdf VIP
- 2025年江苏省连云港市中考数学试卷(含答案).pdf VIP
- 2026-2030中国管线钢行业市场深度调研及发展潜力与投资研究报告.docx
- 2021年B证(安全员)总结考试必选题.doc VIP
- 长安铃木天语SX4电路图.pdf VIP
原创力文档

文档评论(0)