- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一节 引言 多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵。例如在研究公司的运营情况时,要考虑公司的获利能力、资金周转能力、竞争能力以及偿债能力等财务指标;又如在研究国家财政收入时,税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等都是需要同时考察的指标。显然,如果我们只研究一个指标或是将这些指标割裂开分别研究,是不能从整体上把握研究问题的实质的,解决这些问题就需要多元统计分析方法。为了更好的探讨这些问题,本章我们首先论述有关随机向量的基本概念和性质。 在实用中遇到的随机向量常常是服从正态分布或近似正态分布,或虽本身不是正态分布,但它的样本均值近似于正态分布。因此现实世界中许多实际问题的解决办法都是以总体服从正态分布或近似正态分布为前提的。在多元统计分析中, 多元正态分布占有很重要地位,本书所介绍的方法大都假定数据来之多元正态分布。为此,本章将要介绍多元正态分布的定义和有关性质。 然而在实际问题中,多元正态分布中均值向量和协差阵通常是未知的,一般的做法是由样本来估计。这是本章讨论的重要内容之一,在此我们介绍最常见的最大似然估计法对参数进行估计,并讨论其有关的性质。 第二节 基本概念 一、随机向量 我们所讨论的是多个变量的总体,所研究的数据是同时p个指标(变量),又进行了n次观测得到的,我们把这个p指标表示为X1 ,X2,…,Xp,常用向量X = (X1 , X2 , … , XP) 表示对同一个体观测的p个变量。这里我们应该强调,在多元统计分析中,仍然将所研究对象的全体称为总体,它是由许多(有限和无限)的个体构成的集合,如果构成总体的个体是具有p个需要观测指标的个体,我们称这样的总体为p维总体(或p元总体)。上面的表示便于人们用数学方法去研究p维总体的特性。这里“维”(或“元”)的概念,表示共有几个分量。若观测了n个个体,则可得到如表2.1的数据,称每一个个体的p个变量为一个样品,而全体n个样品组成一个样本。 二、多元分布 三、随机向量的数字特征 第三节 多元正态分布 一、多元正态分布的定义 二、多元正态分布的性质 第四节 多元正态分布的参数估 计 一、多元样本的数字特征 二、均值向量与协差阵的最大似然 估计 三、Wishart分布 第五节 多元正态分布参数估计 的实例与计算机实现 通过上面的理论分析知道,多元正态总体均值向量和协差阵的最大似然估计分别是样本均值向量和样本协差阵。利用SPSS软件可以迅速地计算出多元分布的样本均值向量、样本离差阵和样本协差阵。下面通过一个实例来说明多元正态分布参数估计的SPSS实现过程。 从沪深两市上市公司中随机抽取300家公司,取其三个反映收益情况的三个财务指标:每股收益率(eps)、净资产收益率(roe)和总资产收益率(roa)。现要求对这三个指标的均值和协差阵进行估计。 一、均值向量的估计 在SPSS中计算样本均值向量的步骤如下: 1. 选择菜单项Analyze→Descriptive Statistics→Descriptives,打开Descriptives对话框,如图2.1。将待估计的三个变量移入右边的Variables列表框中。 2. 单击Options按钮,打开Options子对话框,如图2.2所示。在对话框中选择Mean复选框,即计算样本均值向量。单击Continue按钮返回主对话框。 3. 单击OK按钮,执行操作。则在结果输出窗口中给出样本均值向量,如表2.2。即样本均值向量为(0.175,0.044,0.026)。 二、协差阵的估计 在SPSS中计算样本协差阵的步骤如下: 1. 选择菜单项Analyze→Correlate→Bivariate,打开Bivariate Correlations
文档评论(0)