网站大量收购独家精品文档,联系QQ:2885784924

基于闭欧拉直方图的空间查询代价模型.docVIP

基于闭欧拉直方图的空间查询代价模型.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于闭欧拉直方图的空间查询代价模型.doc

基于闭欧拉直方图的空间查询代价模型   摘 要:欧拉直方图是空间查询代价估算的一种简便而有效的方法。有许多的研究基于这种方法。但是欧拉直方图对空间对象的统计存在计数错误的问题,以MBR近似描述二维空间对象,文[1]提出了闭欧拉直方图并证明了其统计方法的正确性。文[2]以简单凸多边形近似描述二维空间对象,证明了闭欧拉直方图和欧拉公式同样适用于估算在此描述上的空间选择代价。基于简单多边形的近似描述,改进原有的计数方法,可进一步扩展闭欧拉直方图的使用范围。此外,本文给出了该代价模型的一个应用。   关键字:空间查询优化;空间选择;代价模型;欧拉直方图   中图分类号:TP311.13 文献标识码:A DOI:10.3969/j.issn.1003-6970.2013.06.020   0 简介   空间查询优化是提高空间查询的效率的主要措施之一,是空间数据库研究领域的一个主要方向[3]。代价估算通过估算执行计划的代价来选出一个最优计划以指导查询的执行,从而优化空间查询。早期的空间代价估算研究以数据集上建立的索引为基础。但在实际情况中,空间查询所访问的数据集上往往没有建立足够的索引(例如作为查询所得中间结果的数据集),因此,直方图作为一种适用于数据集上不存在索引的代价估算方法引起了研究者关注。   针对空间选择和空间连接这两种常用的查询操作,研究者已提出了多种直方图以及基于这些直方图的代价估算方法[3]。其中,研究者在欧拉直方图上做了较深入的代价估算研究[1-5]。这些文献所使用的统计方法存在着边界问题。文[1]提出闭欧拉直方图统计方法以修正这一错误。   以上研究多数用MBR来近似描述空间对象。在使用近似度更高的描述形式表示空间对象的基础上,建立相应的代价模型,从而提高代价估算的准确度,这对优化整个空间查询的执行过程具有重要的意义。从现有资料来看,在这方面的研究成果并不多见。在使用多边形近似描述查询窗口和空间对象的情况下,文[4]提出了SQ直方图来估算空间选择的代价,但其准确度易受空间数据分布特征的影响。   无论空间数据是否均匀分布,文[1,2]证明了闭欧拉直方图都能较精确地估算基于MBR和SCP(简单凸多边形)近似描述的空间选择代价。改进统计方法,闭欧拉直方图可有效统计基于简单多边形描述的查询代价,并且此代价模型可以用于计算空间关系查询的代价,由此进一步拓展了闭欧拉直方图的使用范围。   1基于SP描述的闭欧拉直方图   我们约定:将空间对象分布的二维空间称为数据空间;在本文以下讨论中,若无明确说明,用SP (Simple Polygons,简单多边形)近似描述二维空间对象;查询窗口为一矩形,其边界与坐标轴平行。本文将数据空间中与查询窗口相交的空间对象的数目称为空间选择查询代价。   造闭欧拉直方图方法如下[1]:分别用一组水平线和一组垂直线将查询窗口划分为M*N个单元格,然后在每个单元格的内部(cell)、边界(edge)以及顶点(point)分別建立桶(依次称为2维桶、1维桶、0维桶);根据闭欧拉直方图计数方法[1]对每一个空间对象进行计数,计数值存放在相应的桶中。这些水平线和垂直线称为分割线。闭欧拉直方图的例子如图1所示。   在构造了闭欧拉直方图后,对其中各维桶内的计数值使用欧拉公式[7],就能估算空间选择代价。由此,我们先讨论各维桶内的计数方法。   首先,我们引入文[6]的有关概念:   定义1 将多边形各顶点依次按逆时针方向排列,顶点Vi处的角度约定为内角,即由后邻边ViVi+1绕Vi沿多边形内侧旋转到前邻边Vi-1Vi所转过的角度值。若多边形某顶点Vi的内角度q∈(0°,180°),则该顶点是凸的,称为凸顶点;若q∈(180°,360°),则该顶点为凹的,称为凹顶点。   定义2 若构成简单多边形的所有顶点都是凸的,则称该简单多边形为凸多边形;若构成简单多边形的顶点至少存在一个凹顶点,则称该顶点为凹多边形。   目前已有多种分解凹多边形的算法。为了利于使用闭欧拉直方图进行统计,我们采用以下策略来分解数据空间D中的所有对象,并把分解凹多边形的线称为分解线[7]:   Decomposition(S)   {   ①SCPs(S)← Φ//SCP(S)为组成S所有SCP子部分   ②LNs(S)← Φ // LN(S)为用来分解S的所有分解线   ③Partition(S)   }   Partition(SP) //SP为需要分解的对象   {   ①若SP为凸多边形,则SCP(S) ← SCP(S) ∪ SP,退出;否则,进入步骤②;   ②过凹顶点Vi作Vi内角的角平分线Lk,Lk与SP边界的交点为以下情况中的一种:   SP的某条边内的一个点   SP的一

您可能关注的文档

文档评论(0)

guan_son + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档