- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多维数据的数字特征、相关分析.doc
§1.3 多维数据的数字特征、相关分析
除单维分析外, 重要的是分量之间的相关分析.
1. 二维观测数据的数字特征、相关系数
设是二维总体, 样本
(1) 观测矩阵:
(2) 二维观测数据均值向量
其中,;
(3) 观测数据的方差、协方差
,,
,
(4) 观测数据的协方差矩阵
(5) 观测数据的相关系数 ,
1’. 二维总体的数字特征、相关系数
(1) 的分布函数;
(2) 各自的方差;
(3) 总体协方差;
(4) 总体的相关系数;
数据的相关系数是总体的相关系数的相合估计,即
当时, 常有, 有失实意, 故需做
假设检验 .
已有结论: 当为二维正态且为真时, 则
,
值检验:
对于给定的, 若, 则拒, 即认相关.
Pearson相关系数: 即.
Spearman 相关系数 一种秩相关系数
数据的秩 在中的序号
例 样本数据: ,
次序统计量:
秩统计量的值:
例’ 样本数据: ,
次序统计量:
秩统计量值: 或 不惟一;
约定: 对于相同观测值, 同取各位置的平均值.
对例’, 秩统计量值: .
对于总体, 分别可得
关于的秩统计量: ;
关于的秩统计量: .
当相关性较强时,相应的秩统计量相关性也强
Spearman 相关系数
由秩的定义, 易得
经推算(略)得
,
Spearman相关系数也可用于检验假设
(后面介绍).
在SAS系统中, 过程proc corr可计算
1) 多维数据两两间的Pearson和Spearman相关系数
2) 各对变量间相关系数为0的检验值
3) 多维观测数据的均值向量、协方差矩阵
例1.9对于20个随机选取的黄麻个体植株,记录其青植株重量与它们的干植株重量,设服从二维正态分布,其观测数据如下表(略). 求
1) 均值向量, 协方差矩阵;
2) Pearson相关系数, 并检验假设;
3) Spearman相关系数,并检验假设.
解: 调用 proc corr过程得
1) ,
2) Pearson相关系数,
检验值 0.000 1,故与相关性是高度显著的
3) Spearman相关系数
检验值 0.000 1,与相关性也是高度显著的
2. 多维数据的数字特征及相关矩阵
1) 维总体
2) 个观测数据,
均值向量为;
3) 数据观测矩阵 ;
4) 观测数据的协方差矩阵
即.
5) 观测数据的Pearson相关矩阵
记
则有.
6) Spearman相关矩阵
7) 标准化数据处理
(标准化观测矩阵(
3. 总体的数字特征、相关矩阵、多维正态分布
设维总体,
1) 分布函数
2) 均值向量
3) 协方差阵
4) 相关矩阵
记
则 ..
4. 样本数据与总体的关系
先介绍随机向量的性质.
设,,则
1)
特别,
2)
特别
数据的分别是总体的的相合估计,
故当充分大时, 有.
数据的中位数向量
是总体的中位数向量的估计;
Spearman相关矩阵是的稳健估计(抗扰)
5. 多维正态
(1) 概率密度
其中:.
(2) 多维正态分布性质(证略)
1) 设,,则
2) 设, 分割后, 有
,
3) 设, 分割后,
与相互独立(
(3) 多维正态最大似然法估计
设是来自总体的样本,
则的联合概率密度为
最大似然估计:
满足的
结果为
例1.10 对20名中年人测量3个生理指标,3个训练指标, 观测数据见表1.2
(部分数据) 求
(1)观测数据的均值向量,协方差矩阵,Pearson相关矩阵
(2)观测数据的中位数向量,Spearman相关矩阵;
(3)分析各指标间的相关性.
解: (1) 调用proc corr过程, 得
(2) 调用proc corr过程, 得
(3) 若取显著水平, 则
由Pearsons相关矩阵, 得检验值的有
由Spearman相关矩阵, 得检验值的有
由此可知, 相应的变量对, 其相关性较小.
第1章 数据描述性分析
第 2 页 共 24 页
您可能关注的文档
- 八年级下数据分析复习.doc
- 八月份生产运行分析.ppt
- 八里匾隧道爆破设计.doc
- 公众演说之我见.ppt
- 公允价值的应用.doc
- 公共基础知识教育学案例分析题一.doc
- 公需课网络信息技术应用与网络安全.doc
- 六、项目财务分析.doc
- 六下发现与探索.doc
- 六年级科学毕业检测研讨.doc
- 2025年网络文学平台版权运营模式创新与版权保护体系构建.docx
- 数字藏品市场运营策略洞察:2025年市场风险与应对策略分析.docx
- 全球新能源汽车产业政策法规与市场前景白皮书.docx
- 工业互联网平台安全标准制定:安全防护与合规性监管策略.docx
- 剧本杀剧本创作审核标准2025年优化与行业自律.docx
- 2025年新能源电动巡逻车在城市安防中的应用对城市环境的影响分析.docx
- 全渠道零售案例精选:2025年行业创新实践报告.docx
- 2025年网约车司乘纠纷处理机制优化与行业可持续发展报告.docx
- 2025年宠物烘焙食品市场法规政策解读:合规经营与风险规避.docx
- 2025年宠物行业数据安全监管政策影响分析报告.docx
文档评论(0)