(完整word版)常用统计方法.docxVIP

  • 3
  • 0
  • 约1.46万字
  • 约 16页
  • 2020-10-19 发布于山东
  • 举报
主成分分析 主成分分析( principal component analysis ) 将多个 量通 性 以 出 少个数重要 量的一种多元 分析方法。 又 称主分量分析。 在 中, 了全面分析 , 往往提出很多与此有关的 量 (或 因素),因 每个 量都在不同程度上反映 个 的某些信息。但是,在用 分 析方法研究 个多 量的 , 量个数太多就会增加 的复 性。人 自然希 望 量个数 少而得到的信息 多。在很多情形, 量之 是有一定的相关关系的, 当两个 量之 有一定相关关系 , 可以解 两个 量反映此 的信息有一定 的重叠。主成分分析是 于原先提出的所有 量,建立尽可能少的新 量,使得 些 新 量是两两不相关的, 而且 些新 量在反映 的信息方面尽可能保持原有的信 息。主成分分析首先是由 K. 皮 森 非随机 量引入的, 后 H. 霍特林将此方法推 广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。 ( 1 )主成分分析的原理及基本思想 。 原理: 法将原来 量重新 合成一 新的互相无关的几个 合 量,同 根据 需要从中可以取出几个 少的 和 量尽可能多地反映原来 量的信息的 方法叫做主成分分析或称主分量分析,也是数学上 理降 的一种方法。 基本思想:主成分分析是 法将原来众多具有一定相关性(比如 P 个指 ),重 新 合成一 新的互相无关的 合指 来代替原来的指 。 通常数学上的 理就是将 原来 P 个指 作 性 合,作 新的 合指 。最 典的做法就是用 F1 ( 取的第 一个 性 合,即第一个 合指 )的方差来表达,即 Var(F1) 越大,表示 F1 包含 的信息越多。因此在所有的 性 合中 取的 F1 是方差最大的,故称 F1 第 一主成分。如果第一主成分不足以代表原来 P 个指 的信息,再考 取 F2 即 第 二个 性 合, 了有效地反映原来信息, F1 已有的信息就不需要再出 再 F2 中, 用数学 言表达就是要求 Cov(F1, F2)=0 , 称 F2 第二主成分,依此 推可以构 造出第三、第四, ?? ,第 P 个主成分。 ( 2 )步 Fp=a1mZX1+a2mZX2+?? +apmZXp 其中  a1i,  a2i,  ?? ,api(i=1,  ?? ,m)  X 的 方差  Σ的特征 多 的特征向 量, ZX1,  ZX2,  ?? , ZXp 是原始 量 准化 理的 ,因 在 用中,往 往存在指 的量 不同,  所以在 算之前 先消除量 的影响,  而将原始数据 准化, 本文所采用的数据就存在量 影响  [注:本文指的数据 准化是指  Z 准化  ] 。 A=(aij)p  ×m=(a1,a2, ?am,)  , Rai=λiai , R  相关系数矩 ,  λi、ai  是相 的特征 和 位特征向量 , λ1≥λ 2≥?≥λ p。≥0 行主成分分析主要步 如下: 指 数据 准化( SPSS 件自 行); 指 之 的相关性判定; 确定主成分个数m ; 主成分 Fi 表达式; 主成分 Fi 命名; 回归分析 回 分析 ( regression  analysis)  是确定两种或两种以上 数 相互依 的定量关 系的一种 分析方法。运用十分广泛,回 分析按照涉及的自 量的多少,可分 一元回 分析和  多元回 分析;按照自 量和因 量之 的关系 型,可分  性回 分析和 非 性回  分析。如果在回 分析中,只包括一个  自 量 和一个 因 量 ,且 二者的关系可用一条直 近似表示, 种回 分析称 一元 性回 分析。如果回 分析中包括两个或两个以上的自 量,且因 量和自 量之 是 性关系, 称 多 元 性回 分析。 方差 性 性关系 效 累加 量无 量 差 量服从多元 正 分布 察独立 模型完整(没有包含不 入的 量、也没有漏掉 入的 量) 差 独立且服从( 0,1 )正 分布。 数据常常不能完全符合上述假定。因此, 学家研究出 多的回 模型来 解决 性回 模型假定 程的 束。 研究一 个或多个 随机 量 Y1 , Y2 , ? , Yi 与另一些 量 X1 、 X2 , ? , Xk 之 的关系的 方法。又称多重回 分析。通常称 Y1 ,Y2 ,? ,Yi 因 量, X1 、 X2 , ? , Xk 自 量。回 分析是一 数学模型,特 当因 量和自 量 性关 系 ,它是一种特殊的 性模型。最 的情形是一个自 量和一个因 量,且它 大体上有 性关系, 叫一元 性回 ,即模型 Y = a + bX +

文档评论(0)

1亿VIP精品文档

相关文档