地理数据分布的集中化.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
地理数据分布的集中化.ppt

第5节 地理数据分布的集中化 与均衡度指数 罗伦次曲线与集中化指数 基尼系数 锡尔系数 (一)罗伦次曲线 20世纪初,意大利统计学家罗伦次(M. Lorenz),首先使用累计频率曲线研究工业化的集中化程度。后来,这种曲线就被称之为罗伦次曲线。 绘制罗伦次曲线实例 (1)将表2.5.1各产业部门的收入及其占总收入比重(百分比),从大到小重新排序; (2)从大到小,逐次计算累计百分比; (3)以自然序号为横坐标(x),累计百分比为纵坐标(y);以(部门代码,累计百分比)为坐标点,连成一个上凸的曲线(图2.5.1和图2.5.2),即罗伦次曲线。 表2.5.1 某地区农户家庭经营性纯收入水平及其构成 图2.5.1 1999年农户家庭经 营性纯收入构成的罗伦次曲线 结果分析 罗伦次曲线的上凸程度,表示农户家庭经营性纯收入的部门集中化程度。上凸程度越大,就表示农户家庭经营性纯收入越是集中于某些产业部门。 如果各个产业部门的收入是均等的,则罗伦次曲线正好就变成了正方形的对角线。 比较图2.5.1和图2.5.2,可以看出该地区1999年农户家庭经营性纯收入的部门集中化程度高于2004年。 (二)集中化指数 集中化指数 是一个描述地理数据分布的集中化程度的指数。 显然,I越大,就说明数据分布的集中化程度越高;反之,I越小,就说明数据分布的集中化程度越低(越均衡)。 常采用如下近似取值方法: A——实际数据的累计百分比总和; R——均匀分布时的累计百分比总和; M——集中分布时的累计百分比总和。 集中化指数在[0,1]区间上取值。 只有数据的个数相同而且横坐标划分一致时,才有可比性。 二、基尼系数 基尼系数(gini coefficient) 就是通过两组数据的对比分析,纵、横坐标均以累计百分比表示,从而做出罗伦次曲线,然后再计算得出的集中化指数。它是通过对人口和收入两组数据进行比较分析,然后将纵、横坐标均以累计百分比表示,作出罗伦次曲线,再计算集中化指数而得到的一个判断收入分配不平等程度的指标。 其原理方法如下: (1)列出每一个区域(部门)的人口与收入占全区(各部门总计)的比重p与w; (2)计算每一区域(部门)的比率w/p; (3)根据w/p值,由小到大将每一地区(部门)排序; (4)按照上述顺序分别计算p和w的累计值X和Y; (5)以X为横坐标,以Y为纵坐标,在直角坐标系中依次连接各点,得到一条下凸的罗伦次曲线。 基尼系数(G)就可以按照如下公式计算 如果用幂函数拟合,则基尼系数的近似计算公式为 根据分组数据,基尼系数也可以按照如下方法近似地计算: 按人均收入由低到高进行排序,分成若干组(如果不分组,则每一户或每一人为一组),每组收入占总收入比重为 ,每一组人口比重为 ,则基尼系数可以按照下式近似地计算 根据中国大陆1978-2002年各省(直辖市、自治区)的人口数和按照可比价格折算的GDP数据,计算基尼系数,结果如图2.5.4。可以看出,在1978-1990年期间,基尼系数虽然出现过几次上升和下降的微小波动,但基本趋势是缓慢地下降的;而在1991-2002年期间,基本上呈现上升趋势。这一结论,与上节计算的加权变异系数是相互印证的。 三、锡尔系数 基尼系数(gini coefficient),用于对经济发展、收入分配等均衡(不均衡)状况,进行定量化的描述。 锡尔系数又称锡尔熵,有两个锡尔系数指标,即锡尔系数T 和锡尔系数L。 两者的不同之处在于锡尔系数T 以收入比重加权计算,而锡尔系数L则以人口比重加权计算。 如果以人口比重加权,锡尔系数 L 的计算公式为 如果以收入比重加权,则锡尔系数 T 的计算公式为 根据各省(直辖市、自治区)的人口和按照可比价格折算的GDP数据,计算1978—2002年中国大陆省际差异的锡尔系数T 值,结果如图2.5.5所示。可以看出,在1978—1990年期间,锡尔系数虽然有微小波动,但基本上呈下降趋势;而在1991—2002年期间,基本上呈现出上升趋势。这一结论,与前面计算出的基尼系数也是相互印证的。 * * 一、罗伦次曲线与集中化指数 图2.5.2 2004年农户家庭经营性纯收入构成的罗伦次曲

文档评论(0)

aiwendang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档