数据质量检查与质量控制讲义doc9页正式版.docx

数据质量检查与质量控制讲义doc9页正式版.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据质量检查与质量控制 要想清楚并深层次的了解数据质量检查与质量控制的原理, 首先应该知道数据质量的基 本概念以及数据误差的来源。 因为在某些情况下, 数据质量问题在很大程度上可以看作是数 据误差问题。 下面我就详细的为大家介绍数据质量的基本概念和误差来源及其分析, 并就其误差,我们再结合相应的检查方法进行精度分析的探讨。 一、数据质量的基本概念 1、准确性( Accuracy ) 即一个记录值 (测量或观察值) 与它的真实值之间的接近程度。 这个概念是相当抽象的,似乎人们已经知道存在这样的事实。 在实际中,测量的知识可能依赖于测量的类型和比例尺。一般而言,单个的观察或测量的准确性的估价仅仅是通过与可获得的最准确的测量或公认的 分类进行比较。 空间数据的准确性经常是根据所指的位置、 拓扑或非空间属性来分类的。 它可用误差( Error )来衡量。 2、精度( Precision ) 即对现象描述的详细程度。 如对同样的两点, 精度低的数据并不一定准确度也低。 精度要求测量能以最好的准确性来记录, 但是这可能误导提供了较大的精度, 因为超出一个测量 仪器的已知准确度的数字在效率上是冗于的。 因此,如果手工操作的数字化板所返回的坐标不可能依赖于比 0.1mm 还要准确的一个“真正的”数值,那么就不存在任何的点,在十分之一的地方是以 mm 表示的。 3、空间分辨率 (Spatial Resolution) 分辨率是两个可测量数值之间最小的可辩识的差异。 那么空间分辨率可以看作记录变化 的最小距离。 在一张用肉眼可读的地图上, 假设一条线用来记录一个边界, 分辨率通常由最 小线的宽度来确定。地图上的线很少以小于 0.1mm 的宽度来画。在一个图形扫描仪中最细 的物理分辨率从理论上讲是由设施的像元之间的分离来确定的。 在一个激光打印机上这是一 英寸的 300 分之一, 而且在高质量的激光扫描仪上,这会细化十倍。如果没有放大,最细的 激光扫描仪的线是看不到的, 尽管这依赖于背景颜色的对照。 因此,在人的视觉分辨率和设 备物理分辨率之间存在着一个差异。 一个相似的区别可以存在于两个最小距离之间, 即当人 操作者操作数字化仪时所区别的最小距离和数字化仪硬件可以不断地报告的最小距离。 比例尺是地图上一个记录的距离和它所表现的 “真实世界的” 距离之间的一个比例。 地 图的比例尺将决定地图上一条线的宽度所表现的地面的距离。例如,在一个 1: 10000 比例尺的地图上,一条 0.5mm 宽度的线对应着 5m 的地面距离。如果这是线的最小的宽度,那 么就不可能表示小于 5m 的现象。 5、误差( Error ) 定义出一个所记录的测量和它的事实之间的准确性以后,很明显对于大多数目的而言, 它的数值是不准确的。误差研究包括:位置误差, 即点的位置的误差、 线的位置的误差和多边形的位置的误差;属性误差;位置和属性误差之间的关系。 地理信息系统的不确定性包括空间位置的不确定性、属性不确定性、时域不确定性、逻 辑上的不一致性及数据的不完整性。空间位置的不确定性指 GIS 中某一被描述物体与其地 面上真实物体位置上的差别;属性不确定性是指某一物体在 GIS 中被描述的属性与其真实 的属性之差别; 时域不确定性是指在描述地理现象时, 时间描述上的差错; 逻辑上的不一致 性指数据结构内部的不一致性, 尤其是指拓扑逻辑上的不一致性; 数据的不完整性指对于给 定的目标, GIS 没有尽可能完全地表达该物体。 二、空间数据质量问题的来源 从空间数据的形式表达到空间数据的生成,从空间数据的处理变换到空间数据的应用, 在这两个过程中都会有数据质量问题的发生。 下面按照空间数据自身存在的规律性, 从几个方面来阐述空间数据质量问题的来源。 1、空间现象自身存在的不稳定性 空间数据质量问题首先来源于空间现象自身存在的不稳定性。 空间现象自身存在的不稳 定性包括空间特征和过程在空间、 专题和时间内容上的不确定性。 空间现象在空间上的不确 定性指其在空间位置分布上的不确定性变化; 空间现象在时间上的不确定性表现为其在发生 时间段上的游移性; 空间现象在属性上的不确定性表现为属性类型划分的多样性, 非数值型 属性值表达的不精确性。因此,空间数据存在质量问题是不可避免的。 2、空间现象的表达 数据采集中的测量方法以及量测精度的选择等受到人类自身的认识和表达的影响, 这对 于数据的生成会出现误差。 如在地图投影中, 由椭球体到平面的投影转换必然产生误差; 用 于获取各种原始数据的各种测量仪器都有一定的设计精度,如 GPS 提供的地理位置数据都 有用户要求的一定设计精度,因而数据误差的产生不可避免。 3、空间数据处理中的误差 在空间数据处理过程中,容易产生的误差有以下几种: 投影

您可能关注的文档

文档评论(0)

187****4751 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档