大数据的空间数据索引技术研讨.pdfVIP

  • 8
  • 0
  • 约1万字
  • 约 4页
  • 2018-01-14 发布于广东
  • 举报
学 术 问题 研 究 (综 合 版) 2014年第 1期 AcademicResearch(Integratededition) 97 大数据的空间数据索引技术研究 曾凤生 (仰恩大学 福建 泉州 362014) 摘 要:详细了解大数据的空间数据索引技术研究现状,对 目前的一系列主要空间数据索引进行阐 述。对现在的主流空间数据索引技术进行论述,依据 R-tree索引、哈希索引、Voronoi图索引和空间填 充曲线的原理,从其本质上分析其各 自特点,从而为大数据的空间数据索引技术研究提供理论基础。 关键词:大数据;空间数据索引;R-bee索引;哈希索引;空间填充曲线 中图分类号:C37 文献标识码:A 文章编号:0000-0129/K(2014)01一o097—04 1引言 空间数据索引是一种根据空间中目标对象的 形状和位置,或空间中目标对象之间的空间相对 近年来,随着物联网和移动互联网的迅猛发 关系④,并按某种关系进行排列的一种数据结构。 展 ,给人们带来了诸多便利,同时也给计算机网 根据其集合特征,空间数据分为点、线、区域等 络带来越来越多数据存储和处理的困难。移动互 几种主要类型。由于空间数据索引应用的普遍性 联网的普及,使用的用户越来越多,用户上传到 和重要性,大量国内外学者对其进行了深入研究, 计算机网络的图片和视屏数据也就越来越多,与 目前已经获得了很多种空间数据索引技术,并根 此同时,用户也对各 自的图片和视屏数据进行分 据各 自的技术特性,应用于各个领域。虽然空间 享和传播,物联网技术使用数以万计的传感器, 数据索引技术很多,但它们基本都是由B树索 也获取到巨大的数据量,移动设备和电脑等也都 引、二叉树索引、哈希函数等发展而来 。空间 在分享和传播大量数据,这就造成全球数据的爆 数据索引主要分为四种:B-tree的索引,二叉树 炸式增长 。据专家统计,2013年的全球数据量 的索引,空间目标排序法和Hashing的索引技术。 是2005年的8倍。目前,物联网和移动互联网都 本文具体总结和分析了大数据中的空间数据索引 以惊人的速度发展,故专家推测,到2020年,全 相关概念,对空间数据索引中的R-tree索引、哈 球数据规模将是现在的20倍。大数据中很大一部 希索引、Voronoi图索引和空间填充曲线进行详细 分来 自移动互联网的地理位置、航空航天遥感以 阐述,指明其各 自特点。 及各种经济社会统计等,这些数据属于大数据的 空间数据。这些数据的复杂度比较高,且更新速 2R-tree索引 度快 ,因此,对作为大数据处理核心的空间数据 索引技术进行研究,具有重要的社会价值 。 R-tree索引是 Guttman在八十年代提出的一 作者简介:曾凤生,男,仰恩大学计算机与信息学院讲师。研究方向:数据库应用,信息系统,电子商务。 曾凤生:大数据的空间数据索引技术研究 2014年第 1期 种将B-tree索引技术拓展到多维情况下的索引技 3哈希索引 术,由于其具有高效索引结构的特点,被广泛应 用于大数据的空间索引中⑨⑥。 哈希索引是指利用哈希函数对空间数据进行 在 R-tree索引技术中,索引记录项必须被叶 定位的索引技术,该索引技术被广泛应用于空间 子节点所包含,再通过相关二元组管理不同的空 数据索引中。其中可

文档评论(0)

1亿VIP精品文档

相关文档