PSR树一种基于R树结点分裂条件索引结构研究.docVIP

PSR树一种基于R树结点分裂条件索引结构研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PSR树一种基于R树结点分裂条件索引结构研究

PSR树一种基于R树结点分裂条件索引结构研究   摘要:R*树——目前查询效果很好的R-树的变种,但是R*-树结点分裂算法复杂度比较高,极大影响了R-树的整体检索性能。针对其缺陷,本文提出了一个更为合理的PS约束条件,进一步提高了结点分裂的合理性。PSR*—树在确保查询性能的前提下,大幅度提高了索引结构的空间利用率,并且大大降低了构造代价和空间开销代价。   Abstract: R*-tree——the most popular variation of R-tree, but the complexity of the R*-tree node splitting algorithm is very high, which restricts the overall efficiency of the R*-tree. This paper improves the constraint condition of node splitting, presents a more reasonable constraint condition PS. PS further betters the rationality of the node division. PSR*-tree reduces the construction overheads with the guarantee of query performance, and improves the space utilization of index structure.   关键词:空间索引;空间数据库;R*-树; PSR*-树   Keywords: spatial indexing, spatial database, R*-tree, PSR*-tree   中图分类号: TV332.5 文献标识码: A 文章编号:   一、前言   R-树结点分裂算法是R-树的重要算法之一。影响R-树查询效率的重要因素之一就是结点分裂问题。R-树是以面积为标准即分裂后的两部分MBR面积和最小。   此算法列出所有符合要求的组合并且从中选取面积和最小的组合。但此算法存在较大缺点即复杂度太高,近似于2M-1,随着M值的不断增加,时间呈指数级增大。此时如果再在R-树插入空间对象时,结点分裂算法将被频繁调用,将会增加建立R-树索引的时间。所以结点分裂算法在实际应用中难以操作。   Guttman本人也认识到了此问题,由此他提出了复杂度分别为平方和线性的两个近似算法。但此算法的缺陷并不能保证分裂后的面积和为最小值。   二、结点分裂算法   R*-树   原始R-树节点分裂通过二次分裂算法实现。为了保证空间利用率,在算法中会无视数据密度的分布,将一部分入囗项简简单单地分配给某个节点,造成很糟糕的结果而且很难补救。   R*—树通过引入强制重插入技术去弥补了R-树的上述缺陷,并且综合权衡交叠、目录矩形周长以及节点覆盖等参数优化插入和分裂结点算法。R*—树提高了空间利用率,改善了整体的检索性能,而且也大大增加了整体索引的构造代价。   其它R—树变种树还很多,如利用最小边界凸多边形的CP—树。在很多批量操作技术中都利用了聚类技术对数据进行集簇划分,以优化节点之间的重叠与覆盖。   三、分裂结点约束条件   上述R*-树类索引的结点分类都有一个约束条件即分裂后每部分的单元个数不小于m(0≤m≤M/2)。其主要作用就是为了保证每个结点(根结点除外)中至少有m个节点。   1.分析其合理性   比较大的m值虽然可以保证结点存储空间的利用率,但是它也限制了结点分裂的合理性。    随着m约束条件的减小(m/M值变小),检索效率的提高,即结点分裂约束条件影响了合理的结点分裂导致了检索效率的下降。因此结点分裂约束条件应该除之。   当结点分裂约束条件去掉后,索引搜索效率仍然下降,即意味着结点约束条件有存在的价值。   无论采用面积和最小值或周长和最小值作为最优目标函数,这个结点分裂结果的目标函数值都是一样的,从图1可以看出(a)图的合理性要优于(b)图。这说明了目前有的最优目标函数还不能全面考虑结点分裂的合理性。            (a) (b)   图1 两种相同的最优目标函数值的不同分裂结果   图2 中的矩形集中的矩形密度比较均匀地分布在整个矩形区域当中,假如没有约束条件去制约,将会得到(a)图的分裂结果。很显然(b)图的合理性要好于(a)图。不言而喻,适当的结点分裂约束条件是完全可以限制类似情况的发生极率。         (a) (b)   图2 分裂约束条件存在的优点   2. PS——分裂约束条件   矩形集

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档