- 39
- 1
- 约3.9千字
- 约 9页
- 2019-08-05 发布于安徽
- 举报
.
.
空气污染研究的主成分分析
一、提出问题
本文对于给定的某城市42天中午12点的空气污染数据进行主成分分析,主要解决以下几个问题:
分别用样本协方差矩阵和样本相关矩阵作主成分分析,对比二者的结果差异;
对原始数据的变化选取三个或者更少的主成分反映,并对所选的主成分做出解释。
二、分析问题
主成分分析旨在利用降维的思想,把多指标转化为少数几个综合指标。在实际问题研究中,为了系统、全面地分析问题,我们必须考虑众多影响因素。因为每个因素都在不同程度上反映了所研究问题的某些信息,并且指标之间有一定的相关性,因而所得到的统计数据反映的信息在一定程度上有重叠。本文中所研究的问题变量较多,因此利用主成分分析法研究本问题,减少计算量和降低分析问题的复杂性。
针对问题一,首先将数据标准化,计算样本协方差矩阵和相关矩阵,然后分别计算样本协方差矩阵和相关矩阵的特征值和特征向量,贡献率和累计贡献率,确定选取成分个数,列出主成分方程并解释主成分意义。
针对问题二,考虑主成分的贡献率,只要主成分的累计贡献率达到80%,就可以反映原始数据的变化,并且对所选取的主成分做出解释。
三、模型假设
1、影响污染程度的变量只有本文中所提到的变量;
2、随机选取的42天;
3、题目中所提到的城市是平衡发展,政府对环境治理干预较小,即此城市的环境不会出现强烈波动;
4、题目中所给的污染浓度及气象参数有效,数据都准确可
原创力文档

文档评论(0)