2-地质数据处理基础.ppt

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2-地质数据处理基础

地质数据处理基础2 洪金益 中南大学地学院 第二章 统计数据的采集与预处理 1 数据的采集 以某化探数据的采集为例,步骤: 采样设计(按国家、行业规范); 采样(保证质和量、记录规范、必要的备注); 加工(防止污染和编号错乱); 送样化验分析(根据研究目的和研究对象的内在关联性来确定分析项目、选择分析方法、仪器类型)。 遥感数据是常用的地质数据之一,订购数据要选择航天器的类型、波段的特点,产品的级别等等。 2 数据预处理 数据预处理 数据预处理的基本方法 预处理的主要内容 数据预处理方法 预处理方法 预处理方法 预处理方法 3 数据的计量尺度 四种计量尺度 定类尺度 (概念要点) 计量层次最低 对事物进行平行的分类 各类别可以指定数字代码表示 使用时必须符合类别穷尽和互斥的要求 数据表现为“类别” 具有=或?的数学特性 定序尺度 (概念要点) 对事物分类的同时给出各类别的顺序 比定类尺度精确 未测量出类别之间的准确差值 数据表现为“类别”,但有序 具有或的数学特性 定距尺度 (概念要点) 1. 对事物的准确测度 2. 比定序尺度精确 3. 数据表现为“数值” 4. 没有绝对零点 5. 具有 + 或 - 的数学特性 定比尺度 1. 对事物的准确测度 2. 与定距尺度处于同一层次 3. 数据表现为“数值” 4. 有绝对零点 5. 具有 ? 或 ? 的数学特性 四种计量尺度的比较 数据类型与统计方法 变量及其类型 统计指标及其类型 数据的质量要求 1. 精度:最低的抽样误差或随机误差; 2. 准确性:最小的非抽样误差或偏差; 3. 关联性:符合数据间的内在关联性,同时满足用户决策、管理和研究的需要; 4. 及时性:在最短的时间里取得并公布数据; 5. 一致性:数据属性的可比性; 6. 最低成本:以最经济的方式取得数据。 原始数据的检查 逻辑检查 从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象; 主要用于对定类数据和定序数据的审核; 计算检查 检查调查表中的各项数据在计算结果和计算方法上有无错误; 主要用于对定距和定比数据的审核; 第二手数据数据的检查 1.适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料; 确定数据是否符合自己分析研究的需要; 2.时效性审核 适用于有时效性的样品分析数据,如水样品; 应尽可能使用可靠的数据; 3.确认是否必要做进一步的加工整理; 数据的筛选 对审核过程中发现的错误应尽可能予以纠正 当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选 数据筛选的内容包括: 将某些不符合要求的数据或有明显错误的数据予以剔除 将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出 数据的排序 按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索 排序有助于对数据检查纠错,以及为重新归类或分组等提供依据 在某些场合,排序本身就是分析的目的之一 排序可借助于计算机完成 数据的排序 定类数据的排序 字母型数据,排序有升序降序之分,但习惯上用升序 汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分 定距和定比数据的排序 递增排序:设一组数据为X1,X2,…,XN,递增排序后可表示为:X(1)X(2)…X(N) 递减排序可表示为:X(1)X(2)…X(N) 定类数据的预处理 要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的; 对定类数据和定序数据主要是做分类整理; 对定距数据和定比数据则主要是做分组整理; 适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据; * 1、地质数据的采集 2、数据的预处理 3、数据的计量尺度 数据预处理的必要性 没有干净的数据不可能获得好的处理结果; 任何数据都是有污染的、有冗余的; 数据一般有多种格式的,要进行统一格式或格式规范化; 空间数据要进行必要的几何(变形)校正; 数据的度量单位要匹配处理; 任何数据都是有误差的,要进行误差处理; 数据总体空间与数据样本空间的一致性(或=); 数据读写(IO)与处理软件之间的转换; 数据预处理(data preprocessing)或数据清洗(data scrubbing)或数据清理(data cleaning)或数据净化(data cleansing)是数据处理的第一步。 目的:使数据适合于后续的处理工作,提高数据的准确度、整体性、可用性,有助于提高数据处理的质量。 不同类型的数据有

文档评论(0)

busuanzi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档