我们常用到的数理统计方法是回归分析法与相关分析.docVIP

我们常用到的数理统计方法是回归分析法与相关分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
我们常用到的数理统计方法是回归分析法与相关分析

数理统计方法在大气污染评价中的应用 【摘要】本文通过SPSS数理统计软件中的回归分析和聚类分析模块对我国主要城市的工业废气排放量和处理量进行分析,采用了中国统计局网站公布的2010年我国主要城市废气中主要污染物排放情况的数据,依据空气污染的几个重要指标:工业SO2排放量、工业NOX排放量、工业粉尘排放量、生活SO2排放量、生活NOX排放量、生活烟尘的排放量进行聚类分析,得出了影响评价工业废气排放量的几个主要因素和处理情况的简单方法,实证分析的结果与其它方法所得结论一致,并收到较好的效果。 关键词:聚类分析;回归分析;判别分析;空气污染 一 问题提出与分析 空气污染问题已经成为一个全球化问题,尤其是我国正处于一个经济快速发展的时期,工业以及生活带来的空气污染已经严重威胁着我们的生命健康。作为一个环境领域的科学研究者,我们利用科学的技术手段判断空气中污染因子,检验其含量,监控其含量的变化值,当我们收集整理这些数据时,应该如何分析影响空气质量的主要指标,以及如何分析各变量之间存在着的某种复杂的或者简单的关系。这里我们采用了多元统计分析方法。 多元统计分析方法在实际数据处理中有着重要的作用。它不仅可以通过观察值对总体进行参数估计和假设检验,还可以通过相应的方法达到数据化简,分类和研究变量间依赖关系的目的,并能预测变量间关系,提出假设检验等目的。目前在医学、教育学、社会学、地质学、考古学、环境保护等各个领域有及其广泛的作用。这里我们主要利用多元统计方法解决环境学与工程科学研究领域中城市空气污染评估问题。 本文主要采用回归分析和聚类分析模型的方法分析我国主要城市工业废气排放及处理情况。先采用逐步回归的方法进行分析,寻求最优的回归方程,找到影响年运行费用的主要因素和估计的简便方法;再采用系统聚类法对工业SO2排放量、工业NOX排放量、工业粉尘排放量、生活SO2排放量、生活NOX排放量、生活烟尘的排放量进行聚类分析,找到评价工业废气排放及处理情况的简便方法。 二 数学模型、原理及算法 1.回归分析方法模型 回归分析就是一种处理变量间相关关系的数理统计方法。它不仅可以提供变量间相关关系的数学表达式(通常称为经验公式),而且可以利用概率统计知识对此关系进行分析,以判别其有效性;还可以利用关系式,由一个或多个变量值,预测和控制另一个因变量的取值。进一步可以知道这种预测和控制达到了何种程度,并进行因素分析。 逐步回归就是按因子X1,X2……Xm对y作用的大小,这种作用可用偏回归离差平方和衡量,由大至小地逐个将因子引入回归方程,对已被引入方程中的因子,在新因子引入后有可能因变成对y作用不显著而随时从方程中剔除出去,已剔除的因子在新变量引入后也可重新放回,以便获得具有某种最优性质的回归方程.具体地说,逐步回归的每一步是在已引入回归方程的变量中选出一个对y作用最小,即偏回归离差平方和最小的变量,在预定的显著水平下进行F检验,以决定其是否从回归方程中剔除,在剔除了所有不显著变量之后,对那些不在回归方程中的变量仍根据其编回归离差平方和的大小决定哪些因子引入方程,即挑选哪个引入于回归方程后能使偏回归离差平方和有最大增加的变量,并经显著性检验显著后将它引入回归方程,继续这个过程直到回归方程中的变量均不能剔除,即所有引入方程中的变量,其偏回归离差平方和均达到了显著水平,同时又不能再引入新变量,这时宣布逐步回归结束,此时所得最优方程中的变量对因变量均有显著影响。 2.聚类分析方法模型 聚类分析是寻找一种能客观反映样本之间远近关系的统计量可把元素分成若干类的统计方法,它包括样本聚类和变量聚类两种。本文主要运用Average方法和Ward方法(利差和平方)对样本进行雷剧分析。 类平均法,测量两类没对观测间的平均距离,即: 离差平方和的基本思想来源于方差分析,如果分类正确,同类样本的离差平方和应当较大。类间与类内的离差平方和分别为: 系统聚类分析是目前应用最为广泛的一种聚类分析方法。其基本思想是:先将待聚类的n个样品(或者变量)各自看成一类,共有n类;然后按照事先选定的方法计算每两类之间的聚类统计量,即某种距离(或相识系数),将关系最密切的两类并为一类,其余不变,即n-1类;再按前面的方法新类与其他类之间的距离(或者相识系数),再将关系最密切的两类并为一类,其余不变,即n-2类;如此重复计算下去,每次重复都减少一类,直到最后所有样品(或者变量)归为一类为止。 三 实验数据收集及预处理 本文的研究对象是2003年我国主要城市工业废气排放量及处理情况统计表(如下表3-1),这里采用了中国统计局网站2011年公布的2010年我国主要城市废气中主要污染物排放情况的数据,并对数据进行简单的处理分析。 表3-1 主要城市工业废气排放及处理情况 (2003年) 城 市 工业二氧化硫

文档评论(0)

ailuojue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档