数据可靠性是研究的基石.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
北京大学光华管理学院(ID:gsmpku)授权转载 导读 随着PM2.5污染的严重性被越来越多地认识,PM2.5数据的质量也成为人们关心的话题。目前,公众判断所在城市PM2.5污染程度最常用的两大数据源,一是美国驻华大使馆(或领事馆)所发布的数据,二是中国环保部的实时播报。然而,中国环保部所发布的数据真实性却不时遭到质疑,例如《华尔街日报》就曾在2012年的一篇报道中称:北京官方的PM2.5数据与美国大使馆的数据不一致!也有不少学者著文,研究探讨中国空气污染数据的人为干扰。一些公众也持怀疑态度,认为环保部门“美化”数据的讨论不绝于耳。 数据可靠性是研究的基石,如果没有高质量的数据真实反映一个城市大气的污染程度,大气污染防治就无从谈起。因此,北大陈松蹊教授带领的统计科学中心和光华管理学院研究团队,选取北京、上海、广州、成都、沈阳五个城市美国使/领馆及其邻近的环保部站点在2013-2015三年间的PM2.5数据,完成了《空气质量评估报告(二):中国五城市空气污染状况之统计学分析》,运用统计学方法交叉验证了美国使/领馆和邻近的环保部站点数据的可靠性。 (报告大合集已包含本报告,可发送1到数据局后台获取) ▼以下为报告内容的节选和整理▼ 为了交叉验证数据的可靠性,我们分别使用美国使/领馆和邻近环保部站点两个独立数据源的PM2.5数据,分析和比较了描述大气污染不同状态的统计量的一致性和相关系数。同时,在剔除气象因素对数据造成的影响后,使用两个数据源的数据分别计算出各站点的PM2.5的月均值和百分位数浓度。通过多方面、多层次的相互对比和相关性分析,我们发现,使用这两个数据源所得到的空气质量评价,有着比较高的一致性。这可以在一定程度上,为公众对中国主要城市空气污染数据质量的评估提供一个参考依据。 01 数据来源的选取 本报告使用的PM2.5数据,来自五个城市的美国使/领馆及其邻近的环保部站点(北京3个,其他城市2个)。其中环保部的数据始于2013年1月1日,美国使/领馆的数据分别起始于:北京,2010年1月1日;上海,2012年1月1日;广州,2012年4月1日;成都,2012年6月1日;沈阳,2013年5月1日。 北京 上海 广州 成都 沈阳 五城市美国使/领馆(蓝色)和邻近的环保部站点(红色)及相应气象站的地理位置图,飞机符号代表各城市机场所在位置(黑色),图片点击可放大。 上图显示了五个城市美国使/领馆以及邻近的环保部站点的地理位置。其中,除了广州的第五中学站离美领馆较远(8公里)外,其他环保部站点均与美国使/领馆的距离不超过6公里。对于所有站点,我们研究的数据均截止于2015年12月31日。需要指出的是,美国使/领馆只公布PM2.5的相关数据,而我国环保部站点则会同时公布其他主要污染物的数据。 如我们在此前发布的《北京城区研究报告》(下载地址附后)中所强调的,气象条件对PM2.5的浓度变化影响显著。因此,在这次报告中也重点观察了气象数据。气象数据主要来源于各个城市的机场观测站。其中,北京首都机场的数据来自于/;上海、成都、沈阳的机场数据皆来自于/;广州较为特殊,由于白云机场与美领馆及邻近环保部监测站分别处于白云山的两侧,气象条件会相差较大,所以我们采用的是位于污染监测站点同一侧的国家气象局59287站点的数据。上图也显示了五个城市气象数据所在站点的位置。本报告使用的气象变量包括:逐小时气温、气压、露点温度、风向、风速以及降水。由于相对湿度可以由气温和露点温度完全决定,所以无需考虑。 02 各源头数据初步对比 尽管美国使/领馆和邻近环保部站点物理距离比较接近,但是由于每个站点所在地的污染源、地形和扩散条件不尽相同,所以得到的空气质量统计指标也将不会完全相等。然而,由于每个城市的站点所承受的城市范围内的污染排放压力大体相似,所以如果数据质量好、准确性较高,使用各站点数据得到的空气质量的统计指标,也应具有相同的趋势和较强的相关性。 为了检验美国使/领馆和邻近的环保部站点PM2.5数据的一致性,我们对每一个城市每一个站点的PM2.5浓度数据,计算了“优良空气”、“污染状态”和“严重污染”这三个空气质量状态下的平均持续时间,以及其所占时间比例分布。下面两个表格分别给出了这两类描述统计量的数值与分布值。 *的个数代表检验美使/领馆与邻近的环保部站点持续时间是否相等的显著性水平(无*:p值大于0.05,表示无显著性差异;*:p值介于0.025和0.05之间;**:p值介于0.01和0.025之间;***:p值小于0.01。) 在统计学意义上解读这两个图,美国使/领馆和邻近的环保部站点关于三种空气质量的统计数值有显著不同吗(需要说明的是,统计学意义上的一个统计指标的显著相同或不同,是考虑到了数据的随机变异性及其概率分布)?为了回答这

文档评论(0)

44422264 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档