- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
空气质量数据的异常值监测
【摘要】 目的:海量的空气质量数据中,异常数据会干扰后续的实验与分析。因此,有必要对异常数据进行监测,提高数据的准确性。方法:通过对北京市AQI和空气污染物和天气气象数据的分析,发现AQI与这些因素具有较高的相关性。通过逐步回归的方法找出AQI与PM2.5,PM10,CO, ,温度,相对湿度相关性很强,进而我们建立了多元回归模型。之后,我们对单一的AQI进行检测,使用ARMA时间序列模型,有效地减少多重线性和过度参数化对模型的影响。结果:结合监测值和真实值图像可以看出这两种模型大部分监测数据与真实数据相同,只有个别天数出现异常,符合实际的情况。
【关键词】 多元回归 ARMA时间序列 异常值检测 空气质量
The Abnormal Value Monitoring of Air Quality
Abstract: the objective: the abnormal data will disturb subsequent experiments and analysis in lots of air quality data. Therefore, it is necessary to monitor abnormal data to improve the data accuracy. The method: through the analysis of AQI, air pollutant data and weather data in Beijing, we find that AQI has a higher correlation with these factors. With the method of stepwise regression, we also find that AQI also has a strong correlation with PM2.5, PM10, CO, temperature and relative humidity, and then we establish a multiple regression model. After that, the single AQI is tested, and we use an ARMA time series model to reduce the influence of multiple linear and excessive parameterization on the model. The result: combining the monitoring value and true value image, we can find that most monitoring data are the same as true data for these two models, with a few abnormal day-numbers, which is in accord with the actual situation.
Key words: multiple regression; ARMA time series; abnormal value monitoring; air quality
引言
空气质量问题始终是政府、环境保护部门和全国人民关注的热点问题。空气质量监测是空气质量科学表征的重要数据来源,其目的是获得高质量的环境监测数据,并由此推断整个环境现有的质量特征。但在实际监测过程中,样品的采集、分析和采样地点的偶发事件以及各种环境要素本身的时空变化等一系列因素都可能对监测结果产生影响,导致数据出现异常。
以往对此课题的研究最为常见的即为“断点检验法”的方法[1],发现数据中的确存在值得关注的造假问题,其表现是:在临界点上出现不连续的断点。二氧化硫和二氧化氮的数据异常并不明显。在有便是利用数学统计的方法[2]研究中直观判断残差图,方差齐性时在零值附近随机波动,不带任何趋势。直观判断残差平方图,由于残差均值为零,从而残差异方差性取决于参加平方的性质,方差齐性意味着残差平方图在某个值附近波动,不具有某种趋势。构造检验统计量,异方差的检验实质上就是异方差相关性检验,考虑残差均值为零,只需对残差平方的随机性进行检验,即如果残差满足随机性,而残差平方满足相关性,就说明残差具有异方差性。
本文通过多元回归分析和ARMA(2,3)模型对AQI 进行监测,及时的发现异常值,以便于对异常点进行合理分析,剔除其中的可疑或不合理的数据,并分析产生异常的原因,使被监测的客观环境质量状况能够得到真实反映。
一、模型构建与
原创力文档


文档评论(0)