我国主要城市空气质量面板数据聚类剖析.docVIP

下载本文档

11
0
约4.64千字
约 9页
2018-11-16 发布于福建
举报
版权申诉

我国主要城市空气质量面板数据聚类剖析.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

我国主要城市空气质量面板数据聚类剖析

我国主要城市空气质量面板数据聚类剖析　　摘要：我国的空气质量问题牵动着千千万万老百姓的心，为了深入了解全国31个重要城市的空气质量和空气污染方面的差异，根据地方的不同，制定不同的污染防范和治理措施，了解各地的环保态势和水平，运用面板数据的聚类分析方法对全国31个省会城市的从2006到2012年的空气质量达到及好于二级的天数，以及可吸入颗粒物这两个指标的地区差异进行实证分析。　　关键词：城市空气质量；面板数据；聚类分析　　中图分类号：F2文献标识码：A文章编号2014 　　1引言　　自从改革开发以来，我国的经济发展取得了显著的进步。但是，经济的发展也带来了一系列隐患，其中最重要的一条就是环境问题。目前，我国乃至全世界的环境污染问题都十分的严峻。最近，环境污染重最引人关注的一项就是空气质量问题。PM2.5、雾霾等等已经成为经常挂在嘴边的话语。今年我国空气质量标准的重新修订，特别把PM25纳入监测内容，并已经开始在多个试点城市开始运作，加强了政策实施的力度和强度，体现了国家对空气污染的高度关注。尽管我国政府制定并不断完善了法律法规体系，使环境保护取得了一定的进展。但环境形势非常严峻的状况仍然没有太多的改变，发达国家用了百年时间完成了工业化，相比之下我国完成现代化的时间非常之短，这也不可避免的引起环境污染在我国近20多年来集中出现，呈现复合型、结构型、压缩型的特点。表现为许多城市空气污染严重，雾霾出现频繁，主要污染物的大量排放量超过了环境承载能力，等诸多大气环境问题。由此我们可以认识到，污染的防治不仅仅是一个环境问题而且是重大的经济和政策问题，是一个关系到国计民生的问题。为了深入的了解全国各大城市空气污染的差异，更好的把握防治空气污染的力度，本文应用单指标面板数据的聚类分析方法对全国31个主要城市从2006到2012年的空气质量达到及好于二级的天数，以及可吸入颗粒物这两个指标的地区差异进行实证分析。　　2单指标面板数据的聚类分析　　计量经济学模型在分析经济问题的时候只是利用了时间序列或者截面数据中的二维数据的信息，例如使用一个或者若干经济指标的时间序列建模或不同样本的横截面数据建模。然而，在分析实际经济问题中，这种仅利用二维信息的模型在很多时候往往不能满足人们分析问题的需要。近些年来，面板数据的理论研究和应用研究得到了较为广泛的应用和发展，但是主要都是面板数据的模型参数估计方法的研究以及计量建模。但是很少学者能够把其应用到多元统计分析中来Bonzo D.C.和Hermosilla A.Y.（2002）将面板数据应用到多元统计分析中来。Bonzo D.C.运用概率连接函数（probability link function）和遗传算法改进聚类分析的算法，从而对面板数据进行聚类分析。本文试图结合了聚类分析的基本思想对单指标面板数据进行聚类分析的方法进行研究和实证分析。　　2.1聚类分析原理　　聚类分析（cluster analysis）是一类将数据所研究对象进行分类的统计方法。这是一种无监督的聚类方法。这一类方法的共同特点是：事先不知道类别的个数与结构；分析的依据是对象之间的相似性或者是相异性。把相似性或者相异性的大小或者差距看作是对象之间的“距离”远近的一种有效度量，将距离近的对象归为一类，并且不同类之间的对象距离较远，这是聚类分析的分析方法和共同思想。　　面板数据也称作时间序列与截面混合数据，是截面上个体在不同时点的重复观测数据。面板数据用双下标变量yit表示，其中i=1，2，…，N；t=1，2，…，T。其中i对应面板数据中的不同个体。其中N表示这个面板数据中含有N个体总数。面板数据的聚类分析首先将不同个体独自成一类，一共分为N类。第二步是把相似程度最接近的两个的面板数据指标聚成一类，其他的仍独自为一类，共有N-1类。最后一步仍是将相似程度最为接近的两类聚成一类，这样一直进行下去直到最后得到的面板指标聚成一类。　　2.2Ward方法　　Ward方法的大体思想是这样的：首先我们确定一个关于每个类别聚类优劣的指标，也就是说，如果某一类聚集的越紧密，我们就认为聚合的越好，这些数据应该被聚合为一类，这时候我们引入离差平方和作为一个有效的指标，也就是说某一组的离差平方和越小，就说明这一类聚集的越紧密，反之说明某一类离散程度较高。同一类的离差平方和是：　　wk=i∈Gk（xi-xk）T（xi-xk）　　现在我们考虑的是如何确定哪两个组合成一类，假设有这两个类别：Gk和GL两个类别组合之后为：GM我们要使得增加的离差平方和最小，也就是说D2KL=WM-WK-WL最小，这就是，Ward方法，也就是离差平方和法的思路，但是我们首先需要对数据进行有效的预处理，也