- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3.时空数据压缩
时空数据的有损压缩算法
信息计算11级
题目思路和整体要求
时间、空间、属性是地理现象的三个基本特征,也是GIS数据库的三种基本数据组成。
这里的“空间”指空间位置数据及其派生数据。
“属性”指与空间位置无派生关系的专题属性数据。
“时间”则指时间、空间和属性状态的时变信息。
题目场景
时空数据库的数据主要来自于一类按照时间周期返回位置及属性数据的传感器,例如GPS,这类传感器通常会被安装在一些移动的个体上,比如车辆或者个人。通过传感器周期传回的位置及属性数据,系统可以完整的记录下个体的移动轨迹以及对应时间属性值(如速度、温度等)。当前的应用发展趋势表明,被监测个体的数目正在呈爆炸性的增长,同时随着技术的进步以及应用的需求,数据回传的周期也越来越短。例如,南京市的私家车保有量大约在100万台左右,如果后台系统想要实时的知道每台车的位置及属性信息,至少需要对每台车进行秒级采样,我们假设每次每台车上传的数据为50字节,其每天的数据增加将达到: 4.02T=50byte/条*100万*24*60*60
可以想见系统长时间的运行将占用非常庞大的磁盘空间,反之如果针对这些采集数据进行有效的压缩,而且压缩算法具备较高的压缩比,则能够节约大量的磁盘空间,极大的降低系统的建设成本。
数据压缩分为有损和无损两大类。有损一般采用线性拟合的方法,而无损则通过各类近似霍夫曼编码的方法压缩数据。有损压缩的精髓主要是如何抽取特征点,以特征点的连线来近似地表示(拟合)原始数据曲线。本题对时空数据做如下定义:struct Data{ long long time; double x; double y; double z;}; 其中time代表位于移动个体的采集器上传数据的绝对时间,x,y,z分别代表该个体在当前时刻所在空间位置的三个坐标,因此同一采集器一组按时序排列的Data可以看做是一个个体在一段时间内的位移轨迹,为降低难度,本题目不考虑当前时刻采集的属性值。 题目要求实现一套针对单一个体按时序排列的位置数据的有损压缩算法,即将一条基于等间隔时间变化的三维曲线进行压缩,要求能够对这条曲线进行拟合还原,原始点与拟合点的欧式距离之差小于某一给定参数。
功能性需求
根据提供的6000个等时间间隔时空数据,根据时序实现一套有损压缩算法,该算法需具备极高的效率以及压缩比。 若有损压缩阈值设置为x,则还原后的数据与元数据的欧氏距离差不能大于x,压缩比至少达到6:1,即压缩后至多只保存1000个事件。数据拟合后每个拟合值与原始值的误差都必须在有损压缩设置的阈值范围0.1以内,拟合度越高越好。
算法接口:
int compress(Data data_in[], int count_in, Data data_out[], int count_out, double deadband);
data_in:需要压缩的数据,时空数据数组
count_in:数组的个数
data_out:压缩过后的数据
count_out:压缩后剩下的数据
deadband:压缩死区
int decompress(Data data_in[], int count_in, Data data_out[], int count_out, int timeStep)
data_in:需要还原的数组
count_in:数组的个数
data_out:还原后的结果
count_out:原数据个数
timeStep:时间的步进值
开发环境及要求
代码采用c++方式实现,要求在win 平台上用vc能够编译通过。
有损压缩算法要求:
压缩后的Data数量越少越好。
压缩与还原所需时间越少越好。
拟合还原后的数据与原数据的欧氏距离不得大于有损压缩阀值,拟合值与原始值的误差越小越好。
计算过程中所需计算机资源(cpu,内存)越小越好。
有损压缩算法基本思路
题目相关经典算法
矢量数据的压缩
矢量数据压缩的目的是删除冗余数据,减少数据的存贮量,节省存贮空间,加快后继处理的速度。下面介绍几种常用的矢量数据的压缩算法,以及它们之间的异同点。
1、道格拉斯——普克法(Douglas—Peucker)
2、垂距法
3、光栏法
1、道格拉斯——普克法(Douglas—Peucker)
基本思路:对每一条曲线的首末点虚连一条直线,求所有点与直线的距离,并找出最大距离值dmax,用dmax与限差D相比: 若dmax<D,这条曲线上的中间点全部舍去; 若dmax≥D,保留dmax对应的坐标点,并以该点为界,把曲线分为两部分,对这两部分重复使用该方法。
2、垂距法
垂距法的基本思路:每次顺
您可能关注的文档
- Timesten内存数据库新特性.ppt
- 用winRAR制作自动升级包.doc
- Z11压缩机实验指导书.doc
- 03.09 讲师培训材料 TTT training Approach V2.ppt
- 07压缩与熵编码.doc
- 第二小组物流英语作业.ppt
- 专利翻译基础培训.ppt
- 面向对象程序设计Chapter 01.ppt
- 微软TechEd 07香港的幻灯片元素.ppt
- linux实验三 文件压缩和备份.ppt
- 半导体材料性能提升技术突破与应用案例分析报告.docx
- 半导体设备国产化政策支持下的关键技术突破与应用前景报告.docx
- 剧本杀市场2025年区域扩张策略研究报告.docx
- 剧本杀行业2025人才培训体系构建中的市场需求与供给分析.docx
- 剧本杀行业2025年人才培训行业人才培养模式创新与探索.docx
- 剧本杀行业2025年内容创作人才需求报告.docx
- 剧本杀行业2025年区域市场区域剧本市场消费者满意度与市场竞争力研究报告.docx
- 剧本杀市场2025年区域竞争态势下的区域合作策略分析报告.docx
- 剧本杀行业2025人才培训与行业人才培养模式创新.docx
- 剧本杀行业剧本创作人才心理素质培养报告.docx
文档评论(0)