- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
矢量数据压缩方法简介
2010021979 钟亚平
摘要:本文阐述了矢量空间数据压缩的概念,评价矢量空间数据压缩方法的常用指标。对常见的适量空间数据压缩方法了介绍与评价,并对一些改进方法做了介绍。
关键词:矢量空间数据,压缩,DP算法
引言
WebGIS是通过Internet为网络用户提供空间信息共享与分析的一种软件技术,是GIS重要的发展方向之一。然而,描述现实世界的空间数据量是具大的,面对如此海量的空间数据,数据的存储及在有限网络宽带下的传输一直是限制WebGIS应用的瓶颈之一。对空间数据进行压缩,以减少存储空间和提高传输速率。另外由于应用的日益扩大,导致了多比例尺特征GIS的需求,而目前建立多比例尺特征GIS的常用方法是重复数字化,但这种方法耗资巨大,数据采集与建库工作繁重,数据不稳定。因此,研究有效的GIS数据简化压缩方法十分重要。由于栅格数据的文件格式比较统一,而且其压缩技术已经非常成熟,所以本文重点介绍矢量空间数据的压缩技术。
相关概念
矢量空间数据压缩
GIS中的矢量数据可分为点状图形要素、线状图形要素、面状图形要素。但从压缩的角度来看,矢量数据的压缩主要是线状图形要素的压缩,因为点状图形要素可看成是特殊的线状图形要素,面状图形要素的基础也是线状图形要素,需要由一条或多条线状图形要素围成。因此,线状图形要素的压缩就成为矢量数据压缩中最重要的问题。
矢量数据压缩是从组成曲线的点集合A中抽取一个子集B,用这个子集B在一定的精度范围内尽可能地反映原数据集合A,而这个子集B的点数应尽可能少。
矢量数据压缩与化简的核心是在不扰乱拓扑关系的前提下对原始采样数据进行合理的删减。
对矢量数据进行压缩除了能节约存贮空间,加快网络传输速度之外,其本质的原因在于原始的数据存在一定的冗余。这种数据冗余一方面是数据采样过程中不可避免产生的;另一方面是由于具体应用变化而产生,比如大比例尺的矢量数据用于小比例尺的应用时,就会存在不必要的数据冗余。因此应该根据具体应用来选择合适的矢量数据压缩与化简算法。
矢量数据压缩率与压缩误差
压缩率和压缩误差是评价一个矢量数据压缩算法的基本要素。
分别以N和n表示矢量数据压缩前后的结点数。矢量数据压缩率为压缩后点的数量与压缩前点的数量之比,即η= (N-n) / N * 100%。
目前,描述压缩误差的方法主要有三种,分别是最大位移距离、位移距离之和以及偏差面积。假设压缩前的曲线为Fs,…,Ft,压缩后的线段L。最大位移距离是指压缩前曲线Fs,…,Ft上的点到压缩后线段L的最大距离,通过最大位移距离可以控制压缩后的曲线的位移偏差。最大位移距离的具体计算公式为:
。
位移距离之和是指压缩前曲线Fs,…,Ft上的点到压缩后线段L的距离之和。位移距离之和具体计算公式为:
。
偏差面积是指偏差面积是指压缩前曲线Fs,…,Ft和压缩后线段L组成封闭图形的面积。偏差面积具体计算公式为:
。
矢量空间数据压缩方法分类
对空间数据的压缩技术可分为无损压缩和有损压缩。
无损压缩算法又分为两种:
一种是基于现在成熟的通用压缩算法。比如zip、rar等,但该方法没有考虑到矢量数据特有的特征,因此压缩比不高,很少单独使用;
另一种是考虑到矢量数据本身的特征以及矢量数据的表达精度的有限性对存储的数据类型进行处理来达到数据压缩的目的。例如李青元等提出用int甚至short型代替double和float型来存储空间坐标点以取得较高压缩比例的方法。
而有损压缩,特别是对矢量图形(如:MapInfo的MID和基于XML的SVG矢量数据)的有损压缩,近年来引起了不少学者的关注。目前,矢量数据压缩算法主要有:距离控制类算法,如垂距限值法、Douglas—Peucker算法(Spliting算法);角度控制类算法,如角度限值法;黄培之1995年提出的具有预测功能的曲线矢量数据压缩方法;以及基于小波技术的压缩方法。
另外基于文档模型的压缩也有不少文献讨论,比如基于GML,基于XML。
矢量空间数据压缩经典理论与方法
垂距限值法与角度限值法
这两种方法的大概思路为,计算某个点到它前后相邻两点所成直线的距离或角度,如果大于某个阀值就保留,如果小于阀值则舍弃。将这个过程应用于曲线除端点外的所有点,最后的结果就是压缩后的曲线。
这两种方法确定点的保留取决于它两邻的两点,不利于整体的表现。角度限值算法效率低,不常用。垂距法可能因为线的反向而导致结果不一样。也有文献讨论将两种方法综合,即垂距与角度都满足条件时才保留点的压缩方法。
2、Douglas-Peucker算法(DP算法)
基本思想:首先确定曲线的最左边和最右边作为起始点(对于闭曲线) ,对于开曲线,可选择其两个端点作为起始点。然后找出位于两个端点之间的曲线离散点距这两个端点联机的最
文档评论(0)