(四川大学)研究生的博弈论课程:第八章典型相关分析.docVIP

  • 4
  • 0
  • 约9.53千字
  • 约 18页
  • 2021-06-29 发布于湖北
  • 举报

(四川大学)研究生的博弈论课程:第八章典型相关分析.doc

第八章 典型相关分析 §8.1 典型相关分析及基本思想 一、定义 在一元统计分析中,研究两个随机变量之间的线性相关关系,可用相关系数(称为简单相关系数);研究一个随机变量与多个随机变量之间的线性相关关系,可用复相关系数(称为全相关系数)。1936年荷泰林(Hotelling)在《生物统计》发表一篇论文《两组变式之间的关系》首先将它推广到研究多个随机变量与多个随机变量之间的相关关系的讨论中,提出了典型相关分析。 二、应用 实际问题中,两组变量之间具有相关关系的问题很多,例如: ①几种主要产品如猪肉、牛肉、鸡蛋的价格(作为第一组变量)和相应这些产品的销售量(作为第二组变量)有相关关系; ②投资性变量(如劳动者人数、货物周转量、生产建设投资等)与国民收入变量(如工农业国民收入、运输业国民收入、建筑业国民收入等)具有相关关系; ③患某种疾病的病人的各种症状程度(第一组变量)和用物理化学方法检验的结果(第二组变量)具有相关关系; ④运动员体力测试指标(如反复横向跳、纵跳、背力、握力等)与运动能力测试指标(如耐力跑、跳远、投球等)之间具有相关关系等。 ⑤个人表现与家庭的社会经济状况的关系; ⑥典型相关分析还可以应用于对应关系的研究,如夫妻之间、代际之间、干群之间、供求之间所存在的两组多变量之间关系的研究。 三、基本思想 首先在每组变量中找出变量的线性组合,使其具有最大相关性,然后再在每组变量中找出第二对线性组合,使其分别与第一对线性组合不相关,而第二对本身具有最大的相关性,如此继续下去,直到两组变量之间的相关性被提取完毕为止。有了这样线性组合的最大相关,则讨论两组变量之间的相关,就转化为只研究这些线性组合的最大相关,从而减少研究变量的个数。 典型相关分析就是研究两组变量之间相关关系的一种多元统计方法,设两组变量用,,…,及,…,表示。要研究两组变量的相关关系,一种方法是分别研究与(;)之间的相关关系,然后列出相关系数表进行分析,当两组变量较多时,这样做法不仅烦琐,也不易抓住问题的实际;另一种方法采用类似主成分分析的做法,在每一组变量中都选择若干个有代表性的综合指标(变量的线性组合),通过研究两组的综合指标之间的关系来反映两组变量之间的相关关系。 例如,,,,表示一组变量;,,表示另一组变量。研究它们之间的相关关系,就是希望构造一个,,,的线性函数及,,的线性函数: 。 该式称为典型变式,aij称为典型系数。 要求它们之间具有最大相关性。如图8-1所示。 Y Y Cv1-1 Cv1-2 Cv1-3 X1 X2 X3 X4 X Cv2-1 Cv2-1 Cv2-3 。。。。 Y1 Y1 Y1 Cr1 Cr2 Cr3 图8-1 典型相关分析示意图 称自 变量X为预测变量(predictor variables)。 称因变量Y为标准变量(criterion variable)。 在有隐含的或明确的因果联系假设时,主要研究一个方向的作用。在完全没有内在的因果关系时,就需要进行双向的分析。当然,只要组内变量不变,结果是一样的。 §8.2 典型相关分析的数学描述 设有两组随机变量 , 记,不妨设, 假定的协方差阵 ,均值向量(否则只要以代替即可),相应的将剖分为 其中,是第一组变量的协方差阵, 是第一组与第二组变量的协方差阵, 是第二组变量的协方差阵。 要研究两组变量之间的相关关系,前面已介绍两组变量的线性组合,即 其中: ,为任意非零常数向量,易见: 我们希望寻求和使达到最大,但由于随机变量乘以常数时不改变它们的相关系数,为防止不必要的结果重复出现,最好的限制是令Var,Var。于是我们的问题就成为在约束条件: Var,Var,寻求和使 达到最大。 §8.3 总体的典型相关系数和典型变量 一、总体的典型相关系数和典型变量的求法 在约束条件: ① 时寻求和使达到最大值, 根据数学分析中条件极值的求法引入Lagrange乘数,可将问题转化为求 ② 的极大值,其中,是Lagrange乘数。 由极值的必要条件为 ③ 将上二式分别左乘与,则得 而=,所以,这就是说恰好是线性组合和之间的相关系数。于是解方程组③归结为解方程组: ④ 为了具体求解,以左乘④中第二式并将第一式代入得 ⑤ 用左乘④式第一式并将第二式代入得 ⑥ 用左乘⑤式得 ⑦ 用左乘⑥式得 ⑧ 记 则得 说明既是又是的特征根,、就是其相应于和的特征向量。 和的特征根有如下性质

文档评论(0)

1亿VIP精品文档

相关文档