第二章地理数据的类型.ppt

下载文档 降价啦

9
0
约1.06万字
约 75页
2017-06-28 发布于湖北
举报
版权申诉
保障服务

第二章地理数据的类型.ppt

1、本文档共75页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第二章地理数据的类型

显然，I越大，就说明数据分布的集中化程度越高；反之，I越小，就说明数据分布的集中化程度越低（越均衡）。常采用如下近似取值方法： A——实际数据的累计百分比总和 R——均匀分布时的累计百分比总和 M——集中分布时的累计百分比总和集中化指数在[0，1]区间上取值。只有数据的个数相同而且横坐标划分一致时，才有可比性。二、基尼系数基尼系数（Gini coefficient），就是通过两组数据的对比分析，纵、横坐标均以累计百分比表示，从而做出洛伦兹曲线，然后再计算得出的集中化指数。它是通过对人口和收入两组数据进行比较分析，然后将纵、横坐标均以累计百分比表示，作出洛伦兹曲线，再计算集中化指数而得到的一个判断收入分配不平等程度的指标。原理方法如下：列出每一个区域（部门）的人口与收入占全区（各部门总计）的比重p与w；计算每一区域（部门）的比率w/p；根据w/p值，由小到大将每一地区（部门）排序；按照上述顺序分别计算p和w的累计值X和Y；以X为横坐标，以Y为纵坐标，在直角坐标系中依次连接各点，得到一条下凸的洛伦兹曲线。基尼系数（G）就可以按照如下公式计算：假若洛伦兹曲线的解析式为：显然，该曲线下方区域的面积为：对应于绝对均衡分布，其洛伦兹曲线就是正方形的对角线，其下方区域的面积为R=1/2。（2.5.6）如果用幂函数拟合，则基尼系数的近似计算公式为：式中：可以通过最小二乘法（详见第3章）拟合，即：（2.5.7）对于分组数据，基尼系数也可以按照如下方法近似地计算：按人均收入由低到高进行排序，分成若干组（如果不分组，则每一户或每一人为一组），每组收入占总收入比重为wi，每一组人口比重为pi，则基尼系数可以按照下式近似地计算：式中：为从第1组到第i组的累积收入比重。（2.5.8）根据中国大陆1978－2002年各省（直辖市、自治区）的人口数和按照可比价格折算的GDP数据，计算基尼系数，结果如下图。可以看出，在1978－1990年期间，基尼系数虽然出现过几次上升和下降的微小波动，但基本趋势是缓慢地下降的；而在1991－2002年期间，基本上呈现上升趋势。这一结论，与上节计算的加权变异系数是相互印证的。 1978—2002年中国大陆省际收入差异的基尼系数三、锡尔系数锡尔系数也可用于对经济发展、收入分配等均衡（不均衡）状况，进行定量化的描述。锡尔系数又称锡尔熵，有两个锡尔系数指标，即锡尔系数T和锡尔系数L。两者的不同之处在于锡尔系数T以收入比重加权计算，而锡尔系数L则以人口比重加权计算。如果以人口比重加权，锡尔系数L的计算公式为：式中： n为区域（部门）个数；为地区（部门）收入占全区（各部门总计）的份额；为i地区（部门）的人口占全区（各部门总计）的份额。（2.5.9）如果以收入比重加权，则锡尔系数 T的计算公式为：锡尔系数越大，就表示收入分配差异越大；反之，锡尔系数越小，就表示收入分配越均衡。（2.5.10）根据各省（直辖市、自治区）的人口和按照可比价格折算的GDP数据，计算1978—2002年中国大陆省际差异的锡尔系数T值，结果如下图所示。可以看出，在1978—1990年期间，锡尔系数虽然有微小波动，但基本上呈下降趋势；而在1991—2002年期间，基本上呈显出上升趋势。这一结论，与前面计算出的基尼系数也是相互印证的。 1978－2002年中国大陆省际收入差异的锡尔系数 * 描述地理数据一般水平的指标平均值，反映了地理数据一般水平。计算方法： ① 未分组的地理数据 ② 分组的地理数据 (2.4.1) (2.4.2) 第i组的频数第i组的组中值第i组的频数样本的个数组数描述地理数据一般水平的指标中位数 ① 对于未分组的地理数据，样本数n为奇数时，中位数是位置排在第(n+1)/2位的数据；样本数n为偶数时，，中位数是排在中间位置的两个数据平均值。 ② 分组的地理数据，中位数的计算步骤 : A、确定中位数所在的组位置（以总频数/2判定） B、按下述公式计算中位数: 或 (2.4.3) (2.4.4) 中位数组的下限中位数组的上限总频数的一半中位数所在组以下的累积频数中位数组的频数中位数所在组以上的累积频数众数:众数就是出现频数最多的那个数 ① 未分组的地理数据：根据每一个数据出现的频数大小直接确定众数。 ② 对于已经分组的地理数据: a.频数最多的组为众数所在组。 b.按以下公式计算众数: 或 (2.4.5) (2.4.6) 众数组频数与下一组频数之差众数组频数与上