稳健统计对经济的作用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
稳健统计对经济的作用 作者:李伯东李一微单位:浙江申嘉湖杭高速公路有限公司浙江省交通工程建设集团 一、以人均收入水平指标为例对统计稳健性的思考 在现实生活中,公众很有可能对官方公布的人均可支配收入或人均工资之类的指标数据不以为然,认为这些指标具有偏高的倾向。抛开统计误差和统计口径的影响,对人均指标产生歧义的主要原因在于收入分配是一种偏态的分布,随着影响贫富差异的因素增多,偏态呈日益严重的态势。同时收入分布中存在着异常极端的离群值,也会导致收入平均值的不正常上升。 平均数,特别是算术平均数是我们在各种媒体上经常看到和听到的经济条件指标,对其观察值的代表性研究一般是用以方差为主的若干类指标。然而均值和方差应用的条件则往往被人们所忽视,典型的表现就是不考虑观察值本身具有何种分布形态分布的偏斜程度以及观察值中是否存在一定量的离群值。 就数据的纯度量特征而言,若收入数据中存在着百万甚至亿万收入的富翁时,会极大地拉动人均收入的上升。这表明用算术平均方法计算的人均收入指标受到离群值的较大干扰,这种影响有时甚至会抵销掉其他绝大多数数据对均值的影响。在这种情况下,算术平均值并不是一个好的统计指标。相反,对于人均收入之类位置特征值而言,若以中位收入代替算术人均收入,则会对极值的干扰有较大的抗御性。就收入分布而言,中位收入较之算术平均收入是一个具有抗离群值干扰能力的稳健统计量。 人均收入水平的统计指标,除了可以用可支配总收入除以平均人数的方法得到以外,更多的情况下,是通过官方统计系统城调队的1000户问卷调查产生的,并据此来推断总体的人均指标。相应的统计量和检验值的解释都是建立在正态分布的假定之下的。因此人们往往认为只要正态分布的假定得到满足或基本满足就可以大胆使用人均收入指标,而不必再担心它的稳健性,因而可使用很多方法来检验收入分布是否为正态。 若没有关于总体分布精确的先验信息时,则只要样本容量n足够大,就可以认为样本分布是总体分布的自然逼近,但是当n很小时,是无法判断分布的正态性的。对于收入分布这样一种人的经济标志的分布而言,1000个样本单位并不能从实际上表明它具有一个足够大的样本容量。相反,对于人类身体、体重之类的自然特征指标,一般均可以直接假定它的分布正态性。这也表明人的经济特性分布较之人的自然特征分布更加复杂,而收入分布就是其中的一个典型。收入分布中存在的一定数量的离群值,虽然占数据个数总量的比例并不高,但是对算术人均收入的影响非常大,如通常所说的20%的高收入人群拥有80%的收入总量。人们试图通过正态分布拟合检验的办法来考察离群值对正态性的影响,问题在于有些正态性的检验结果对少量离群值对正态性造成的偏差,无法得到恰当的结论(例如利福斯正态性检验方法)。因而收入数据中的离群值对于基于正态假定下才有用的统计量会产生破坏性的影响。 收入分布的复杂性及很难确认的状况,使得传统的人均收入指标局限性凸现,用它来描述和推断收入水平,以及制定相应收入政策、就业政策和税收政策就显得不是很全面,有时甚至会得出错误的结论。因此寻求稳健统计方法和计算稳健统计量,对于收入分布来讲是非常重要的。 稳健统计量是相对于传统统计量而言的,两者是在比较中发展起来的。传统统计量往往侧重的是统计量的一系列计算程序。而稳健统计则将对统计量代表性的讨论,放在对数据分析特征的认识基础之上。稳健统计量首先强调对分布特征的探索,然后才是统计量的计算过程问题。就人均收入指标而言,若不明了收入分布的特征,则人均收入指标的解释力就会大大降低甚至起到负作用。 二、稳健统计的基本思想 在高斯发现/正态分布0以及最小二乘法提出之时,就有了/统计稳健性0的思想萌芽。正态分布下的各种统计量,包括均值、众数等均有较好的估计量特征,尤其是在对称分布下这些特征表现得更加充分,即使在稍有偏态的对称分布中,这些统计量也具有一定的抗御离群值的能力。应用得非常广泛的最小二乘估计量在和正态分布的前提结合的时候,也具有很多众所周知的优良性质。 正态分布假定下各种参数估计和假设检验的方法,诸如以样本均值估计总体期望值,以样本方差估计总体方差,检验统计量在原假设成立时服从正态分布的检验规则建立等等,都是优良的估计量和估计方法,无偏性、有效性和一致性等高效率性无论怎样论证都会得到理想的结论。正态分布下各种统计方法得以快速发展。 但是从对经济、社会、管理以及自然科学中各种现象的实际问题和数据分析中发现,正态分布的基本假定有时不能满足,或者即使是一个正态分布,但是否是理想化的正态分布也是值得怀疑的,人们往往发现很多数据分布是非正态和非对称的。有些统计专家甚至建议,正态分布可能不会代表大多数的分布形态,最好以其发明者的姓氏命

文档评论(0)

187****0670 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档