- 40
- 0
- 约4.19千字
- 约 48页
- 2016-08-04 发布于重庆
- 举报
第1章_主成分分析
第一章 主成分分析
第一节 引言
多元统计分析处理的是多变量(多指标)问题。由于变量较多,增加了分析问题的复杂性。但在实际问题中,变量之间可能存在一定的相关性,因此,多变量中可能存在信息的重叠。人们自然希望通过克服相关性、重叠性,用较少的变量来代替原来较多的变量,而这种代替可以反映原来多个变量的大部分信息,这实际上是一种“降维”的思想。
主成分分析也称主分量分析,是由Hotelling于1933年首先提出的。由于多个变量之间往往存在着一定程度的相关性。人们自然希望通过线性组合的方式,从这些指标中尽可能快地提取信息。当第一个线性组合不能提取更多的信息时,再考虑用第二个线性组合继续这个快速提取的过程,……,直到所提取的信息与原指标相差不多时为止。这就是主成分分析的思想。一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;因此,通过主成分既可以降低数据“维数”又保留了原数据的大部分信息。
我们知道,当一个变量只取一个数据时,这个变量(数据)提供的信息量是非常有限的,当这个变量取一系列不同数据时,我们可以从中读出最大值、最小值、平均数等信息。变量的变异性越大,说明它对各种场景的“遍历性”越强,提供的信息就更加充分,信息量就越大。主成分分析中的信息,就是指标的变异性,用标准差或方差表示它。
主成分分析的数学模型是,设p个
您可能关注的文档
最近下载
- 商业交房标准.pdf VIP
- 幼儿小班教学节气课件.ppt VIP
- 维保工程施工方案(3篇).docx VIP
- 2021-2022学年福州市连江县八年级上学期期中数学试卷(B卷)(含答案解析).docx VIP
- 《植物激素》(教案)-中职农林牧渔大类《植物生长和环境》同步教学(高教版)(第四版)(全一册).docx VIP
- 诊断学学习资料:西医诊断学总结.pdf VIP
- 幼儿小班教学节气.pptx VIP
- 《光合作用与呼吸作用的关系》(教案)-中职农林牧渔大类《植物生长和环境》同步教学(高教版)(第四版)(全一册).docx VIP
- 小学生入学行为规范课件.pptx VIP
- 马铃薯组培技术全流程.pdf VIP
原创力文档

文档评论(0)