- 1、本文档共75页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章地理数据的类型
显然,I越大,就说明数据分布的集中化程度越高;反之,I越小,就说明数据分布的集中化程度越低(越均衡)。 常采用如下近似取值方法: A——实际数据的累计百分比总和 R——均匀分布时的累计百分比总和 M——集中分布时的累计百分比总和 集中化指数在[0,1]区间上取值。 只有数据的个数相同而且横坐标划分一致时,才有可比性。 二、基尼系数 基尼系数(Gini coefficient),就是通过两组数据的对比分析,纵、横坐标均以累计百分比表示,从而做出洛伦兹曲线,然后再计算得出的集中化指数。它是通过对人口和收入两组数据进行比较分析,然后将纵、横坐标均以累计百分比表示,作出洛伦兹曲线,再计算集中化指数而得到的一个判断收入分配不平等程度的指标。 原理方法如下: 列出每一个区域(部门)的人口与收入占全区(各部门总计)的比重p与w; 计算每一区域(部门)的比率w/p; 根据w/p值,由小到大将每一地区(部门)排序; 按照上述顺序分别计算p和w的累计值X和Y; 以X为横坐标,以Y为纵坐标,在直角坐标系中依次连接各点,得到一条下凸的洛伦兹曲线。 基尼系数(G)就可以按照如下公式计算: 假若洛伦兹曲线的解析式为: 显然,该曲线下方区域的面积为: 对应于绝对均衡分布,其洛伦兹曲线就是正方形的对角线,其下方区域的面积为R=1/2。 (2.5.6) 如果用幂函数拟合,则基尼系数的近似计算公式为: 式中:可以通过最小二乘法(详见第3章)拟合,即: (2.5.7) 对于分组数据,基尼系数也可以按照如下方法近似地计算: 按人均收入由低到高进行排序,分成若干组(如果不分组,则每一户或每一人为一组),每组收入占总收入比重为wi,每一组人口比重为pi,则基尼系数可以按照下式近似地计算: 式中: 为从第1组到第i组的累积收入比重。 (2.5.8) 根据中国大陆1978-2002年各省(直辖市、自治区)的人口数和按照可比价格折算的GDP数据,计算基尼系数,结果如下图。可以看出,在1978-1990年期间,基尼系数虽然出现过几次上升和下降的微小波动,但基本趋势是缓慢地下降的;而在1991-2002年期间,基本上呈现上升趋势。这一结论,与上节计算的加权变异系数是相互印证的。 1978—2002年中国大陆省际收入差异的基尼系数 三、锡尔系数 锡尔系数也可用于对经济发展、收入分配等均衡(不均衡)状况,进行定量化的描述。 锡尔系数又称锡尔熵,有两个锡尔系数指标,即锡尔系数T和锡尔系数L。 两者的不同之处在于锡尔系数T以收入比重加权计算,而锡尔系数L则以人口比重加权计算。 如果以人口比重加权,锡尔系数L的计算公式为: 式中: n为区域(部门)个数; 为地区(部门)收入占全区(各部门总计)的份额; 为i地区(部门)的人口占全区(各部门总计)的份额。 (2.5.9) 如果以收入比重加权,则锡尔系数 T的计算公式为: 锡尔系数越大,就表示收入分配差异越大;反之,锡尔系数越小,就表示收入分配越均衡。 (2.5.10) 根据各省(直辖市、自治区)的人口和按照可比价格折算的GDP数据,计算1978—2002年中国大陆省际差异的锡尔系数T值,结果如下图所示。可以看出,在1978—1990年期间,锡尔系数虽然有微小波动,但基本上呈下降趋势;而在1991—2002年期间,基本上呈显出上升趋势。这一结论,与前面计算出的基尼系数也是相互印证的。 1978-2002年中国大陆省际收入差异的锡尔系数 * 描述地理数据一般水平的指标 平均值 ,反映了地理数据一般水平。计算方法: ① 未分组的地理数据 ② 分组的地理数据 (2.4.1) (2.4.2) 第i组的频数 第i组的组中值 第i组的频数 样本的个数 组数 描述地理数据一般水平的指标 中位数 ① 对于未分组的地理数据,样本数n为奇数时,中位数是位置排在第(n+1)/2位的数据;样本数n为偶数时,,中位数是排在中间位置的两个数据平均值。 ② 分组的地理数据,中位数的计算步骤 : A、确定中位数所在的组位置(以总频数/2判定) B、按下述公式计算中位数: 或 (2.4.3) (2.4.4) 中位数组的下限 中位数组的上限 总频数的一半 中位数所在组以下的累积频数 中位数组的频数 中位数所在组以上的累积频数 众数:众数就是出现频数最多的那个数 ① 未分组的地理数据:根据每一个数据出现的频数大小直接确定众数。 ② 对于已经分组的地理数据: a.频数最多的组为众数所在组。 b.按以下公式计算众数: 或 (2.4.5) (2.4.6) 众数组频数与下一组频数之差 众数组频数与上
文档评论(0)