- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
收入差距基尼系数的EXCEL算法.doc
收入差距基尼系数的EXCEL算法
一、理论背景
为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家)M.O.洛伦兹(Max Otto Lorenz,1903- )1907年(或说1905年)提出的了著名的洛伦兹曲线。它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH表示人口(按收入由低到高分组)的累积百分比,纵轴OM表示收入的累积百分比,弧线OL为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。一般来讲,它反映了收入分配的不平等程度。弯曲程度越大,收入分配越不平等,反之亦然。特别是,如果所有收入都集中在1人手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL。另一方面,若任一人口百分比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。相应的洛伦兹曲线,既不是折线OHL,也不是45度线OL,而是像图中这样向横轴突出的弧线OL,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL,OHL与45度线之间的面积A+B叫做“完全不平等面积”。不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。基尼系数G=A/(A+B)。显然,基尼系数不会大于1,也不会小于零。
二、计算原理
网上有很多文章对基尼系数的计算方法有着深入的探讨,但都公式复杂吓人,涉及到积分、协方差等概念的运用,不易理解和操作,令人望而却步。本文提出的是样本区间微分面积离散累积法,完全通俗易懂,在EXCEL中只利用四则运算就能得出非常精确的结果。以图2为例:
——条件1:ODGF围成一个长方形,其中D在OH轴的40%位置(表示累计人数占总人数的40%),F在OM轴的10%位置(表示累计收入占总收入的10%),G为洛伦兹曲线上的一个点,代表着累计40%的人群的累计收入占总收入的10%,G的坐标为(40%,10%)
——条件2:OPRK围成一个长方形,其中P在OH轴的60%位置(表示累计人数占总人数的60%),K在OM轴的30%位置(表示累计收入占总收入的30%),R为洛伦兹曲线上的一个点,代表着累计60%的人群的累计收入占总收入的30%,R的坐标为(60%,30%)
——微分面积计算:根据上述条件,直角梯形DPGR的面积S=(DG+PR)×DP÷2,则具体面积为:(10%+30%)×(60%-40%)÷2=0.04
——面积B计算:将每个直角梯形的面积累加,即为面积B的值
——面积A计算:将直角三角形OHL的面积(即1×1÷2=0.5)减去面积B
——基尼系数计算:面积A÷直角三角形OHL的面积
三、测算步骤
1、将已知样本数据(工资收入数值)在EXCEL表中按照从小到大自动排序,形成第一列数据,字段名称“工资排序”
2、第二列数据字段名称设为“人数累计”,即从1开始逐个向下累加,每次累加1人
3、第三列数据字段名称设为“工资累计”,使用EXCEL公式表示:
本单元格数据=上单元格数据+同行的“工资排序”单元格数据
4、第四列数据字段名称设为“人数百分比”,用同行的“人数累计”单元格数据除以人员总数
5、第五列数据字段名称设为“工资百分比”,用同行的“工资累计”单元格数据除以工资总数
6、第六列数据字段名称设为“梯形面积”,按照前述的计算原理编辑公式即可
通过以上步骤,最后将“梯形面积”字段的数值累加,即为前文所述的B面积,用直角三角形面积减去B面积即得A面积,则基尼系数可得。
四、小结
通过以上样本区间微分面积离散累积法所获取的基尼系数,应该说是与理论完全一致的;特别是在样本数量足够多的情况下,甚至可以用线段长度代替梯形面积进行计算(读者可自行证明)。由于计算中没有涉及到任何四则运算之外的概念,且最大限度运用了EXCEL表间公式的功能,使问题的解决简单而高效,充分体现了“复杂问题简单化”的思想,值得借鉴。
另外,在/s/blog_3ec2fd.html上有一篇山西农业大学经贸学院张建华先生在2006年前发表的《推介一个简便易用的基尼系数计算公式》,理论分析更加透澈。本文与该文章的思路方法完全一致,看来“英雄所见略同”,特向张建华先生表示敬意。
董凌云
2009年5月12日
附
文档评论(0)