- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计量地理 第四章 地理数据的采集与预处理
第四章 地理数据采集与预处理 1.地理数据类型及其变换 1.1 地理数据的基本类型: 1.1.1 变量与常量: ①变量:变化的量,例如人口、年降水量、土壤类型等。 ②常量:变量的取值,例如兰州市2000年的人口、7月平均气温等。 1.1.2 定性数据与定量数据 ①定性数据:只有性质差异,而无数量差异的数据。如天气的阴、晴。 ②定量数据:可用数量表示的数据,如气温、降水。 1.2 地理数据的变换 地理数据变换的目的: 去伪存真 易识规律 减小变幅 便于建模 变换方式: 对数变换、开(立)方变换、取倒数变换、概率变换、指数变换等 2.地理数据的分布特征 2.1地理数据的来源与整理 2.1.1地理数据的来源 ① 野外调查; ② 室内化验分析; ③ 定位或半定位观测; ④ 从地形图、航片、卫片上提取的地理信息; ⑤ 从有关部门收集的观测或统计资料; ⑥ 来自于互联网(Internet)的有关共享数据。 2.1.2地理数据的整理 ①整理的步骤:检查资料、统计分组、绘制图表; ②整理的目的:使数据结构化、条理化,便于进一步分析研究. 2.1.3 统计分组 分组标志有两类:质量标志和数量标志。 分组的一般原则,即以是否能归纳出原始数据的分布特征为依据。 统计分组的步骤 第一步:按次序排列原始资料,统计数据个数;计算全距(极差 range) 全距(R)=最大值(max)- 最小值(min) 第二步:确定组数与组距; (1) 组数=1+3.32LgN (2) 组距=全距 /组数 第三步:确定组限并计算组中值 ; (1) 第一组下限=最小值-组距/2 (2) 第一组上限=第一组下限+组距 (3) 第i组下限=第i-1组上限 (4) 第i组上限=第i组下限+组距 (5) 组中值=(下限+上限)/2 第四步:确定每个数据归属于哪个组,统计每一组所包含的数据个数(即频数),同时统计累积频数。 上海市1873-1972年降水量表 组限与组中值表 频数分布表 例1 2.1.4频数分布图表 某组的频数,是指原始地理数据出现在该组内的次数。各组频数和应等于地理数据的总数。频率是各组的频数占总地理数据的百分比。 为了更详细的认识变量的分布特征,还可以计算累计频数和累计频率。 由变量值小的组向变量值大的组累计频数和频率,称为向上累计频数和向上累计频率。 由变量值大的组向变量值小的组累计各组的频数或频率,称为向下累计频数或向下累计频数。 直方图 折线图 累计频数图 直方图及累积频率曲线 2.2地理数据的分布特征值 在地理数据的分布性质中,最重要的两个性质是集中性和离散性。 2.2.1 集中性的代表值:平均数、中位数、四分位数、众数 (1) 平均数:算术平均数、几何平均数 ① 简单算术平均数 算术平均数的局限性: 其数值容易受极大值或极小值的影响,当一组资料存在极端值时,均值的代表性就会受很大影响,这种情况统计上称为不稳健。 例:某河流四个断面上测得污染物酚的浓度为0.036mg/l,0.024mg/l,0.023mg/l,0.019mg/l。每个断面所代表的河段长度分别为3.4km,5.6km,2.7km,4.3km,计算该河流酚污染的平均水平。 解:以断面所代表的河段长度为权重因子,以加权算术平均值来反映该河流的酚污染平均水平,有 该河流酚污染的平均水平是0.025 例4 据统计,中国国民生产总值指数(以上年为100)从1978年至1993年依次为: 111.7,107.6,107.9,104.4,108.8,110.4,114.7,112.8,108.1,110.9,111.3,104.4,104.1,108.2,113.4,113.2, 试求该时期我国经济年平均增长率。 (2)中位数 设一组资料有n个数值,x1,x2,…,xn,若按大小顺序排列,处在数列的中点位置的数值,就是中位数。中位数将全体数据分成项数相等的两部分,因此,中位数也是数据集中趋势的一个很好的测度值。 中位数的推求方法,对于未分组资料,当地理 数据项n为奇数时,变量按大小顺序排列。第(n+1)/2 位数,就是中位数。当地理数据项n为偶数时,中位 数为第n/2项与第(n/2+1)项的平均数。 中位数的特征 a、中位数位于依序排列资料的中间位置,不易受极端值的影响,是较稳健的集中趋势测度量指
文档评论(0)