第二章地理数据及其采集与预处理2012级.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计、统计学 统计的含义 统计数据的搜集活动——统计工作 统计活动的结果——统计数据 分析统计数据的方法和技术——统计学 统计学 统计学是一门收集、整理和分析统计数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。 统计数据的收集:取得统计数据的过程,是进行统计分析的基础。 统计数据的整理:对统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的需要。数据收集与数据分析之间的必要环节。 统计数据的分析:统计学的核心内容,通过统计描述和统计推断的方法探索数据内在规律的过程。 三类现象 自然界和人类社会活动中,普遍存在三类现象。        确定性现象:在相同的条件下出现相同的结果,称为确定性现象或必然现象。如地球的运动。 随机性现象:在相同的条件下出现不同的结果,但结果是确定的,称为随机性现象。如掷硬币。 模糊性现象:在相同的条件下出现不确定的结果,称为模糊性现象。如美人与丑人。 不同现象与研究方法 确定性现象 --- 经典数学 随机性现象 --- 概率统计学 模糊性现象 --- 模糊数学 现代统计学的基本内容 试验设计 数据管理 统计分析 从统计方法的构成来看,统计学可以分为描述统计学和推断统计学。 描述统计学 研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概况与分析得出反映客观现象的规律性数量特征。 描述统计学内容包括统计数据的收集、数据的加工处理方法、数据的显示方法、数据分布特征的概况与分析方法等。 推断统计学 研究如何根据样本数据去推论总体数量特征的方法,是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式的推断。 在统计研究过程中,如果收集到的是总体数据(如普查数据),则经过描述统计之后就可以达到认识总体数量规律性的目的了; 如果所获得的只是研究总体的一部分数据(样本数据),要找到总体的数量规律性,必须应用概率论的理论并根据样本信息对总体进行科学地推断。 统计学思想 从随机性中归纳出规律性 通过变量估计常量 借助样本的研究推断总体的特征 拓扑关系(topological relation) 指满足拓扑几何学原理的各空间数据间的相互关系。即用点、线和面所表示的实体之间的邻接、关联、包含和连通关系。如:点与点的邻接关系、点与面的包含关系、线与面的相离关系、面与面的重合关系等。 变量和数据 在统计上,一般把说明现象某种特征的概念称为变量,数据就是变量的具体表现。 根据变量变化性质可分为随机变量和确定性变量;品质变量和数字变量。 数据大体上分为两种类型:定性数据(也称品质数据)和定量数据。 1、数量变量和数量(定量)数据 数量(数字)变量 是对研究单位的定量特征的描述。诸如个体年龄、身高、体重等变量。数字变量根据其取值不同可以分为离散变量和连续变量。 离散变量只能取有限个值,取值以整位数断开,可一一列举。 连续变量可以取无穷多个值,取值是连续不断的,不能一一列举。 定量数据又称数值型数据(quantitative data) ①这类数据不仅说明现象的属性和状态,而且有数量的概念; ②不仅能比较数据之间的大小,而且可以定量地表示相互之间的差异。 品质变量 是对研究单位的定性特征的描述 常分为有序变量(等级)、名义型变量(类别 )、逻辑变量等类型。 无序多元数据(类型变量) 如血型分为A、B、 AB、 O四类型。 需用三个哑变量来区分。 当 X1=0,X2=0,X3=0时,为AB型 一般N分类,需要N-1个哑变量表示。 总体、样本和样品 【总体】 population 是根据研究目的确定的所要研究同类事物的全体。在统计学中,总体是指研究对象的某项数量指标值的全体(某个变量的全体数值)。只有一个变量的总体称为一元总体;具有多个变量的总体称为多元总体。 【样本】samples 是指由总体中抽取部分个体组成的集合,是总体的一部分。样本包含的样品个数称为样本的容量或者样本的大小。 影响样本对总体代表性的因素主要有:总体本身的离散性;样本容量的大小;取样方法。 【样品】sample 是总体的一个明确部分,是观测对象。 数据误差的来源: 数据获取的不确定性 地理数据获取的多源性 获取有代表性的地理数据 取样过程中的误差 取样误差 以总体为参照物,样本与总体的差异,我们称其为取样误差。 ①取样误差是随机误差,可以对其进行计算,并设法加以控制; ②取样误差不包含系统误差。 非取样误差 ①在获取数据过程中可能出现的误差; ②无响应

文档评论(0)

2266685ss + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档