- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实用标准文档
精彩文案
第1章 多元正态分布
1、在数据处理时,为什么通常要进行标准化处理?
数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是0-1标准化和Z标准化。
2、欧氏距离与马氏距离的优缺点是什么?
欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。在二维和三维空间中的欧氏距离的就是两点之间的距离。
缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。每个坐标对欧氏距离的贡献是同等的。当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。没有考虑到总体变异对距离远近的影响。
马氏距离表示数据的协方差距离。为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。
优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。由标准化数据和中心化数据计算出的二点之间的马氏距离相同。马氏距离还可以排除变量之间的相关性的干扰。
缺点:夸大了变化微小的变量的作用。受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。
3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?
统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵, 则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。
4、如果正态随机向量的协方差阵?为对角阵,证明X的分量是相互独立的随机变量。
解: 因为的密度函数为
又由于
则
则其分量是相互独立。
和是相互独立的随机变量,且~,~。
求的分布。
如果,写出关于与的表达式,并写出的分布。
如果且~,写出关于与的表达式,并写出的分布。
解:(a)由于~,所以~。
(b)由于~,~;
所以~;
故,且~
均值向量和协方差阵的检验
略
2、试谈Wilks统计量在多元方差分析中的重要意义。
3、题目此略
多元均值检验,从题意知道,容量为9的样本 ,总体协方差未知
假设H0: , H1: (n=9 p=5)
检验统计量/(n-1)
服从P,n-1的分布
统计量实际上是样本均值与已知总体均值之间的马氏距离再乘以n*(n-1),这个值越大,相等的可能性越小,备择假设成立时,有变大的趋势,所以拒绝域选择值较大的右侧部分,也可以转变为F统计量
零假设的拒绝区域 {(n-p)/[(n-1)*p]}*
1/10* F5,4(5)
μ0=( 6212.01 32.87 2972 9.5 15.78)’
样本均值(4208.78 35.12 1965.89 12.21 27.79)’
(样本均值-μ0)’=(-2003.23 2.25 -1006.11 2.71 12.01)
协方差矩阵(降维——因子分析——抽取)
Inter-Item Covariance Matrix
人均GDP(元)
三产比重(%)
人均消费(元)
人口增长(%)
文盲半文盲(%)
人均GDP(元)
1020190.840
582.460
331693.531
-599.784
-6356.325
三产比重(%)
582.460
19.480
-105.464
6.625
43.697
人均消费(元)
331693.531
-105.464
125364.321
-213.634
-3130.038
人口增长(%)
-599.784
6.625
-213.634
6.099
25.410
文盲半文盲(%)
-6356.325
43.697
-3130.038
25.410
196.884
协方差的逆矩阵
1.88034E-05
-0.000440368
-6.09781E-05
0-0.000625893
-00.207023949
-0.000210374
-0.0237044
-0-6.0978E-05
-0.000210374
0.
您可能关注的文档
最近下载
- 能耗桥画法示例.ppt VIP
- 2024-2030全球高温氨裂解催化剂行业调研及趋势分析报告.docx
- 2025年吉林省中考英语真题卷含答案解析 .pdf VIP
- 23G409先张法预应力混凝土管桩图集.PDF VIP
- P-02 【中信苏宁】资产支持专项计划计划说明书-20141111.pdf VIP
- 中国人寿:养老险总公司招聘笔试题库2025.pdf
- 设计旅游线路课件(共18张PPT)《旅行社计调业务》(中国言实出版社).pptx VIP
- 2025金考卷45套化学新高考版主书.docx
- 1401沟通你我他——大学生人际交往幻灯片课件.ppt VIP
- 循环水泵能耗桥分析与节能改造实践.pptx VIP
文档评论(0)