基于聚类和主成分分析城市空气质量影响因素研究.docVIP

基于聚类和主成分分析城市空气质量影响因素研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于聚类和主成分分析城市空气质量影响因素研究

基于聚类和主成分分析城市空气质量影响因素研究   摘 要:文章首先运用K均值聚类分析法对全国主要城市2016年的空气质量进行分类,将113个城市分为三类;其次,运用主成分分析对每一类城市影响空气质量的主要因素进行分析,研究表明城市空气质量主要是受两个方面不同程度的影响,分别为粉尘污染(如;居民生活排放的烟尘、建筑垃圾扬尘等)和气体污染(如:汽车尾气、化石燃料燃烧产物等)。   关键词:空气质量 聚类分析 主成分分析 影响因素   中图分类号:O212.4 文献标识码:A   文章编号:1004-4914(2017)09-034-02   一、引言   近年来,随着雾霾天气对人类健康和生活的影响不断加深,对空气质量影响因素的分析及寻找雾霾防范措施成为社会关注的热点问题。目前国内关于空气质量及雾霾的影响因素研究主要针对个别大型城市,也有学者从全国主要城市出发去分析空气质量的影响因素,不过由于我国经济发展及工业分布不均衡的特点,对全国主要城市的空气质量研究需要细化分类,具体分析各类城市空气质量的影响因素,故本文选取我国113个空气质量重点城市运用K均值聚类方法和主成分分析方法进行影响因素研究,从而为雾霾治理提供有效的建议。本文所分析的城市空气质量指标包括二氧化硫年平均浓度、二氧化氮年平均浓度、可吸入颗粒物年平均浓度、一氧化碳日均值95百分位浓度、臭氧最大8小时百分位浓度和细颗粒物年平均浓度等6个指标数据,数据来源于国家统计局统计年鉴,通过定量分析和定性分析结合,对113个空气质量重点城市进行研究。   二、研究方法   (一)K均值聚类分析   K均值作为聚类分析中的一种基本的划分方法,是一种快速聚类的方法,采用该方法得出来的结果简单易懂,对计算机的性能要求不高,所以可以广泛运用。然而这种算法依赖于初始值的选择以及数据的输入顺序并且一些结果不能够满足需要。K均值聚类方法的一般步骤为:   1.选择某些记录作为凝聚点,将所有的样本分成K个初始类。   2.首先,通过欧几里得距离将这些样本按就近原则将记录在离中心最近的类中,然后,计算出各个初始分类的中心位置(均值),最后,用计算出的中心位置重新进行聚类。   3.将第二步反复循环,直到样本不可以再分,且聚类中心收敛为止。   (二)主成分分析   主成分分析主要是通过降维的方法,将多个不同指标转化成为几个相同的综合指标。主成分分析方法首先将原始数据进行标准化;其次建立变量之间的相关系数矩阵;然后,求此相关系数矩阵R的特征值和特征向量;最后写出主成分并且进行分析。   三、空气质量影响因素分析   由于所选数据较多,各个城市的空气质量指标值不尽相同,以至于某些城市同一变量之间的差异比较大,并且城市空气质量之间所存在的规律特征也不明显,所以对113个主要城市整体的空气质量影响因素进行分析不具有代表性,且准确性较差。为了使得所分析的数据更具代表性以及分析过程更加方便,分析结果更加准确,我们运用聚类分析法把113个城市按照空气质量指标的相近程度进行分类。经过多次不同的试验表明,三类以上的话会出现某一类或者两类只包含一个城市,其他类包含的城市相对比较多的现象,所以相比之下分为三类比较合理(聚类中心见表1)。对113个城市的空气质量数据进行K均值聚类分析,将113个城市分成三类,第一类包括:石家庄、唐山、邯郸、保定、临汾、安阳、焦作七所城市,主要集中在河北及河南北部地区,空气质量最差;第二类包括:沈阳、大连、长春、南京、连云港、武汉、成都、重庆等72所城市,主要集中在?S河以北区域,空气质量中等;第三类包括:北京、呼和浩特、太原、郑州、张家界、乌鲁木齐、天津等34所城市,主要集中在沿海和南方一带,空气质量最好。   由于三类城市的空气质量指标差别很大,所以分别对这三类城市进行主成分分析来具体量化每类城市空气质量影响因素的特点。   由表2可以看出,三类城市的前两个主成分的方差累计贡献率分别为89.574%,77.056%和68.988%,所以选择前两个主成份就可以了。下面通过计算主成分得分来量化各变量的载荷。   从表3可以看出对于第一类城市,影响主成分的指标是细颗粒物年平均浓度、可吸入颗粒物年平均浓度、二氧化氮年平均浓度和臭氧最大8小时百分位浓度,影响主成(下转第39页)(上接第34页)分的指标是二氧化硫年平均浓度和一氧化碳日均值95百分位浓度。对于第二类城市,影响主成分的指标是可吸入颗粒物年平均浓度和细颗粒物年平均浓度,影响主成分的指标是二氧化氮年平均浓度、臭氧最大8小时百分位浓度和一氧化碳日均值95百分位浓度和二氧化硫年平均浓度。而对于第三类城市,影响主成分的指标是细颗粒物年平均浓度、可吸入颗粒物年平均浓度、二氧化氮年平均浓度和臭氧最大8小时百分位浓度

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档