- 1、本文档共76页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘 要
近年来,随着雾霾天气的增多,公众的注意力逐渐聚焦到空气质量上来,目
前空气质量已经成为社会与大众共同关注的环境问题之一。污染源的分布、气象
因素和污染物的类型等多种因素影响着城市空气中污染物浓度的高低,不同的
城市污染物浓度的分布特征不同。因此,深入讨论污染物浓度之间的关系和气象
因素与污染物浓度之间的关系,预测 PM2.5 的浓度,对研究城市环境污染、空
气质量问题及研究对于这类问题有效的预防措施具有十分重要的意义。
本文以“基于空气质量监测大数据的污染物分布建模技术研究与应用”课题
为背景,以空气污染物浓度为研究对象,提出了一种基于 ARIMA-SVM 的PM2.5
浓度预测模型,以提高 PM2.5 浓度预测的准确率;并在此基础上实现了空气污
染物监测原型系统。主要研究内容包括:
(1)空气污染物数据的预处理:针对数据中含有缺失值的问题,利用多重插
补法填补缺失值;利用机器学习中的 K-means 聚类算法识别异常值,由六种污
染物数据生成标签,再将数据根据聚类中心进行聚类,将异常点删除。以此整理
出质量较高且具有代表性的数据。
(2)属性间相关性分析:利用 Spearman 秩相关系数分析污染物之间的相关性、
污染物与气象因素之间的相关性;构建 PM2.5 浓度分别与其它五项污染物浓度
间的线性回归模型,验证通过 Spearman 秩相关系数得到的结论。
(3)构建 PM2.5 浓度预测模型:重点研究了 ARIMA 、SVM 算法,并将这两
种算法结合,构建了基于 ARIMA-SVM 的PM2.5 浓度预测模型。该模型将 SVM
与 ARIMA 结合,弥补了传统的 ARIMA 时间序列预测不能处理非线性数据的不
足之处,提高了预测的准确率;同时构建了基于 Keras 的LSTM 神经网络模型预
测 PM2.5 浓度;将 ARIMA-SVM 组合模型与 LSTM 模型进行了对比分析。
(4)空气污染物监测原型系统:利用 Pycharm 、Hbuilder 等工具设计并实现了
空气污染物监测系统。系统实现了城市搜索、城市 AQI 指数排名、城市各个检
测点污染物浓度以及 AQI 变化趋势等功能。
关键词:PM2.5 ;空气质量;相关性;聚类算法;预测
目 录
第一章 绪 论 1
1.1 研究背景及意义 1
1.2 国内外研究现状 2
1.2.1 国外研究现状 2
1.2.2 国内研究现状 4
1.3 主要研究内容及创新点 6
1.3.1 主要研究内容 6
1.3.2 主要创新点 7
1.4 论文组织结构 8
第二章 数据预处理 10
2.1 空气污染物数据理解 10
2.2 数据预处理概述 12
2.2.1 数据分析 12
2.2.2 填补缺失值 13
2.2.3 多重插补法概述 14
2.2.4 利用多重插补填补污染物数据缺失值 16
2.3 识别异常值 19
2.3.1 K-means 算法概述 20
2.3.2 识别污染物数据中的异常值 2 1
2.4 本章小结 25
第三章 属性间相关性分析 26
3.1 相关性分析概述 26
3.2 Spearman 秩相关概述 27
3.3 污染物之间的相关性分析 27
3.3.1 六种主要污染物间的相关性结果分析 28
3.3.2 PM2.5 分别与其它五项污染物间的线性回归模型 28
3.4 PM2.5 与气象因素间的相关性分析 32
3.5 本章小结 35
第四章 基于 ARIMA-SVM 的 PM2.5 浓度预测模型 36
文档评论(0)