海南大学的应用多元统计分析报告方案设计复习真地的题目.docVIP

  • 2
  • 0
  • 约2.58千字
  • 约 7页
  • 2018-12-07 发布于安徽
  • 举报

海南大学的应用多元统计分析报告方案设计复习真地的题目.doc

实用标准文档 精彩文案 定义2.1 将个随机变量的整体称为维随机向量,记为。 定义2.2 设是维随机向量,它的多元分布函数定义为 (2.2) 记为,其中,表示维欧氏空间。 多维随机向量的统计特性可用它的分布函数来完整地描述。 定义2.3 设是维随机向量,若存在有限个或可列个维数向量,记,且满足,则称为离散型随机向量,称,为的概率分布。 设,若存在一个非负函数,使得对一切有(2.3) 则称为连续型随机变量,称为分布密度函数,简称为密度函数或分布密度。 一个元函数能作为中某个随机向量的密度函数的主要条件是: (1),; (2) 离散型随机向量的统计性质可由它的概率分布完全确定,连续型随机向量的统计性质可由它的分布密度完全确定。 定义2.4 设是维随机向量,称由它的个分量组成的子向量的分布为的边缘(或边际)分布,相对地把的分布称为联合分布。 当的分布函数是时,的分布函数即边缘分布函数为: 当有分布密度时(亦称联合分布密度函数),则也有分布密度,即边缘密度函数为: 定义2.5 若个随机变量的联合分布等于各自的边缘分布的乘积,则称是相互独立的。 定义2.6 设,若存在且有限,则称为的均值(向量)或数学期望,有时也把和分别记为和,即,容易推得均值(向量)具有以下性质: (1) (2) (3) 其中,、为随机向量,、为大小适合运算的常数矩阵。 定义2.7 设,,称 (2.4) 为的方差或协差阵,有时把简记为,简记为,从而有;称随机向量和的协差阵为 (2.5) 当时,即为。 若,则称和不相关,由和相 互独立易推得,即和不相关;但反过 来,当和不相关时,一般不能推知它们独立。 当、为常数矩阵时,由定义可以推出协方差阵有如下性质: (1)对于常数向量,有 (2) (3) (4)设为维随机向量,期望和协方差存在,记,,为常数阵,则 这里我们应该注意到,对于任何的随机向量来说,其协差阵都是对称阵,同时总是非负定(半正定)的。大多数情况是正定的。 若的协差阵存在,且每个分量的方差大于零,则称随机向量的相关阵为,其中 (2.6) 为与的相关系数。 在数据处理时,为了克服由于指标的量纲不同对统计分析结果带来的影响,往往在使用各种统计分析之前,常需要将每个指标“标准化”,即进行如下变换, (2.7) 那么由(2.7)构成的随机向量。令,,有: 那么,标准化后的随机向量均值和协差阵分别为 即标准化数据的协差阵正好是原指标的相关阵。 定理2.1 设,则有, 多元正态分布的性质 1.若,是对角阵,则相互独立。 2.若,为阶常数阵,为维常数向量,则 即正态随机向量的线性函数还是正态的。 3.若,将,,作如下剖分 则,。 这里需要指出的是:第一,多元正态分布的任何边缘分布为正态分布,但反之不真。第二,由于,故表示和不相关,因此可知,对于多元正态变量而言,和的不相关与独立是等价的。 一、填空题: 1.多元统计分析是运用 方法来研究解决 问题的理论和方法。 2. 回归参数显著性检验是检验 对 的影响是否显著。 3.聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 聚类和 聚类。 4.相应分析的主要目的是寻求列联表 和 的基本分析特征和它们的最优联立表示。 5.因子分析把每个原始变量分解为两部分因素:一部分为 ,另一部分为 。 6.若=1,2,3….n且相互独立,则样本均值向量服从的分布为_____________。 二、名词解释 1. 随机向量 2.相似数据 3.马氏距离(总体内两点间) 三、简答 1. 简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 2. 简述相应分析的基本思想。 3. 简述求度量MDS古典解的一般步骤。 4. 简述费希尔判别法的基本思想。 5. 简述多元统计分析中协差阵检验的步骤 6. 在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。 7. 比较主成分分析与因子分析的异同点。 8. 简述相应分析的基本思想。 9. 进行相应分析时在对因素A和因素B进行相应分析之前没有必要进行独立性检验?为什么? 四、计算: 1.给出标准化变量X1,X2, X3的协差阵(即相关阵)R,同时给出R的特征值和相应的正交化特征向量。要求:1)计算因子载荷矩阵A,并建立因子模型

文档评论(0)

1亿VIP精品文档

相关文档