- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
37多元统计分析1docx
多元统计分析
第一章绪论
§1.1什么是多元统计分析
在自然科学、社会科学以及经济领域中,常常需要同时观察多个指标。例如,要衡量一个地区的经济发展,需要观测的指标有:
总产值(X1)、利润(X2)、效益(X3)、劳动生产率(X4)、万元生产值能耗(X5)、固定资产(X6)、流动资金周转率(X7)、物价(X8)、信贷(X9)及税收(X10)也就是说一个地区的经济发展,受多种指标共同作用的影响,我们把每一个指标看成一个随机变量,可以单独研究每个随机变量,但这只能揭示该地区经济发展的一个方面,更多的时候需要把把这诸个随机变量一起研究揭示多个随机变量对该地区经济发展的共同影响,以及揭示这些随机变量内在变化规律。
例如,研究某公司的经营状况,需要观测公司的财务指标有:
每股净资产(X1)、净资产收益率(X2)、每股收益(X3)、每股现金流(X4)、负债率(X5)、流动比率(X6)及速动比率(X7)。可以单独研究每个随机变量,更多的时候需要把这诸个随机变量一起研究,揭示这些随机变量内在变化规律。
多元统计分析——研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。
多元统计分析包括的主要内容:多元(正态)总体的参数估计和假设检验、聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析、多重多元回归分析等。
介绍多元统计分析方法时,需要的时候增加一些线性代数的知识。
§1.2多元统计分析能解决哪些实际问题
⑴经济学:对我国32个省市自治区的社会情况进行分析。
⑵工业:服装厂生产服装。为了适应大多数顾客的需要,如何确定服装的主要指标及分类的型号。指标:身长、袖长、胸围、腰围、肩宽、肩厚等十几个指标(主要指标:长度、胖瘦)
⑶投资组合:
§1.3主要内容安排
多元(正态)总体的参数估计、聚类分析、判别分析、主成分分析、因子分析、典型相关分析等。上机操作。
第二章多元正态分布
§2.1基本概念
1.随机向量的概率分布
定义1 将p个随机变量的整体称为p维随机向量,记为
在多元统计分析中,仍然将所研究对象的全体称为总体。
一元总体分布函数和分别密度定义:
为随机变量X的概率分布,记为。
离散型:
k=1,2,3,…
⑴; ⑵
连续型:
; ⑵
定义2 设是p维随机向量,它的多元分别函数定义为
记为,其中记为。
定义3 设是p维随机向量,若存在有限个或可列个p维数向量,,,…,记 (k=1,2,3,…),且满足,,则称X为离散型随机向量,称(k=1,2,3,…)为的概率分布。
设p维随机向量,,若存在一个非负函数,使得对一切,有
则称X为连续随机向量,称为分布密度函数,易见
, ⑵
例1试证函数
为随机向量的密度函数。
证:(1)易见
(2)
定义4 设是p维随机向量,称由q(p)个分量组成的子向量的分布为的边缘(或边际)分布(通过变换中各分量的次序,总可以假定正好是的前q个分量,其余p-q个分量为),即,相应的取值也可以分成两部分。的边缘分布函数为
当有分布密度时,则的分布密度为
例2 对例1中的求边缘密度函数。
解:当时
当时
0
从而有
同理可得到
定义5 若p维随机向量的联合分布等于各自边缘分布的乘积,则称是相互独立的
一切
对于连续型随机变量,有
一切
(有时候根据几何图形判断概率,根据试验的背景判断独立性)
例3 例2中的与是否相互独立?
解:例1中密度函数
例2中求得的边缘分布
及
所以有,即与相互独立。
如果相互独立,则任何与独立,反之不真。
2.随机向量的数字特征
定义6设,若(i=1,2,3,…)存在,则称为X的均值(向量)或期望,也记为
均值向量性质:
⑴
⑵
⑶其中X、Y为随机向量,A、B为常数矩阵。
定义7 设, 称
=
为X的方差矩阵或协方差矩阵,有时简记为
称随机向量X和Y的协方差矩阵为
=
若X的协方差矩阵存在,且每个分量的方差大于零,则X的相关系数矩阵为
其中
(i,j=1,2,3,…,p)
为与的相关系数。记标准离差矩阵
则有
,
易见。实际上,对于任意非零向量,
为半正定矩阵。
例4 设
,则可得
,
容易验证
若,称X与Y不相关。若X与Y独立,则X与Y不相关,反之不成立。(正态分布反之成立)
协方差矩阵性质:
⑴;
⑵;
⑶;
⑷。
§2.2多元正态分布的定义及基本性质
多元正态分布在多元统计分析中所处的地位,如同一元统计分析中一元正态分布所处的地位一样重要,多元统计分析中的许多理论和方法都是直接或间接建立在正态分布的基础上,多元正态分布是多元统计分析的基础。另外,在实用中遇到的随机向量常常是服从或近似服从正态分布。因此,现实世界中许多实际问题的解决办法都是以总体服从正态分布或近似正态分布为前提。
1.(多元正
文档评论(0)