浅论海量数据组织管理方法.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅论海量数据组织管理方法

浅论海量数据组织管理方法   摘要:本文在对海量空间数据进行了一定的分析基础上,探讨了当前针对海量数据组织管理的金字塔结构存储方法和线性四叉树的空间索引结构。并通过示例程序开发验证其有效性。   关键词:空间数据库;海量数据;四叉树;金字塔   Abstract: In this paper, based on the analysis of the massive spatial data, discussed the current spatial index structure in Pyramid according to the structure of storage method and linear mass data organization and management of the four fork tree. And its effectiveness is verified by example program development.   Key words: spatial database; data; four fork tree; Pyramid      中图分类号:C36文献标识码:A文章编号:   1 引言   自90年代以来,高空间分辨率遥感卫星开始向大众敞开大门,作为GIS的重要数据来源——遥感数据量快速增长。卫星遥感影像是一种以栅格数据模型存储的数据,其最明显的特点是数据量大、数据结构单一。同时遥感数据是一种大面积的、动态的、近实时的数据源,是GIS数据更新的重要手段。遥感数据可用于提取线划数据和生成数字正射影像数据、DEM数据[1]。我国的领土面积为960.1216万平方公里,如果全国的遥感影像用QuickBird 0.61m分辨率的影像来记录据估算需要72092.15GB[2]。为了使这些海量空间数据得到更好的应用,必须考虑采用更为有效的组织管理手段对海量空间数据进行组织管理。   解决此问题,在GIS中对大范围空间数据的统一有效的组织管理有很大帮助。早在90年代,美国ESRI公司推出空间数据引擎(SDE)对该问题提供了一种解决方案,依托于关系数据库环境,采用高效空间目标模型(Efficient Spatial Object Model)对空间实体进行完整组织。此举一方面避免了大数据量传统拓扑模型组织数据时需要的大量的硬盘访问操作;另一方面,空间信息作为关系库中的成员,属性信息与图形信息形成一体化,避免了通过标识码连接属性,大大提高了信息检索的效率[3]。同时,在ArcGIS9.0以上版本的ArcCatalog中又新增了栅格目录(Raster Catalog)的数据组织方式,很好的满足了目前流行的以图幅为单位进行空间数据采集并更新的需求。   从当前空间数据的生产及数字化过程看,以图幅为单位进行管理的局面一时难以改变[4]。故本文将讨论以图幅为基本存储单位,在此基础上对其用多金字塔结构进行空间数据组织并利用四叉树作为海量栅格数据的空间索引的海量数据组织存储方法。   2 海量数据分析   在研究海量数据的组织管理方法前,首先要研究如下问题:由于我国的国土面积较大,正射影像产品空间参考大都是以高斯投影后的平面坐标为基础,对于一个省级或国家级的大型影像数据库而言,由于投影分带的原因,正射影像产品的空间参考的起算原点并不相同[5]。尤其内蒙古自治区这类跨地域很长的省份按照高斯投影后的坐标不会是一个3°高斯投影带,每个带的坐标都是以本带的坐标原点为参考点,空间基准不统一,而且相邻两带带边的图幅变形很大。这样,在多个坐标原点和带边数据存在几何变形的情况下,给省级或国家级这样的大型影像数据库的无缝数据组织带来了问题。所以首先要解决的是大型遥感影像数据库的空间无缝浏览的技术,相关的技术已经在其他文献中多次被提到,本文就不再赘述。   3 海量数据组织管理方法   为了提供高速数据查询、显示、刷新以及网络传输等,在组织和管理海量数据时应使用高效的存储形式和快速高效的索引机制。   3.1海量数据存储技术   当前GIS栅格数据库模型分为传统的关系数据库系统(RDBMS)、对象数据库系统(ODBMS)和对象关系数据库系统(ORDBMS)。   下面简要介绍一下GIS栅格数据在Oracle中的存储方式。栅格数据在存入数据库时,需将实体对象之间的关系转换为支持的数据结构模型,根据对象类别在数据库中对应建表,空间对象属性映射为关系数据库中的列或字段,每个空间数据对象对应一条数据记录。栅格数据包含的三类数据中,与记录空间数据对象几何属性的图像数据相对应的字段是一种复杂的数据类型,因此对于空间数据库来说,关键问题是如何利用独立于关系数据库系统的统一数据模型处理反映空

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档