- 1、本文档共80页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * 基于范围查询的最邻近点查询实现算法 * * 5.6.1.3 需要多维空间索引的应用简介 ㈠数据仓库的数据立方体 ㈡地理信息系统(GIS) ㈢CAD/CAM系统 ㈣多媒体信息处理 * * 在数据仓库中,通常需要建立一种称为“数据立方体”的多维数据结构,以更好支持决策分析。 例如,一个全国性连锁店,可能记录每一笔销售,包括销售时间、销售地区和商品的种类等。 事实数据?事实表;可能影响这些销售事实数据的各因子,如时间、地区和商品类型等属性,作为不同的观察维度?维表。 将所有维属性区段组合想象为一个个多维盒式单元,每个事实量(如销售量、销售额等)想象为存储在这些多维盒单元中的一个量。 本质上,可将事实表中每个元组视该空间的一个点。分析人员可按某些维对数据进行分组,并通过聚合操作对这些分组进行汇总。 5.6.1.3 ㈠数据仓库的数据立方体 图5.14 * * GIS被广泛用来处理各种空间数据,包括点、线、二维/三维-区域。 例如,一幅地图中,可能同时包含小目标(点)、河流/公路(线),以及城市/湖泊(区域)等。 GIS能自然提出所有空间查询类型,它必须能有效管理二维、三维数据集, 必须能有效处理空间点数据和区域数据。 当前许多对象数据库系统的都已能很好支持常见的GIS类应用。 5.6.1.3 ㈡地理信息系统(GIS) * * 5.6.1.3 ㈢CAD/CAM系统 这类系统中通常要存储和处理大量的空间对象。类似GIS,这类系统中也必须存储和处理空间点/区域数据。 范围查询和空间连接查询可能是这类应用中最常见的查询。 CAM/CAD也是对象数据库系统发展的一个主要动因。 * * 多媒体涵盖诸如图像、文本和各种类型时间序列数据(音频/视频)等各类对象,也需要空间管理方式。 在多媒体数据库(multimedia databases)中,使用象“查找与特定对象相似的所有对象”这类相似查询可能极为普遍。 回答相似查询的一个通行方法是首先映射/变换多媒体对象到特征向量点,将查找相似对象问题转换为关于特征向量点集的最小邻近点查询问题。 5.6.1.3 ㈣多媒体信息处理 * * 基于内容的图像检索技术 医疗/生物图像数据库 可能要存储大量数字化的二维/三维图像,如X-射线或MRI图像,形成相对完整的、涵盖各种案例的样本图像库; 可基于图像相似匹配技术,处理新采集图像的模式识别问题。 基于指纹数据库,进行给定指纹的匹配搜索,处理指纹识别问题。 基于人脸图像数据库,进行给定人脸的匹配搜索。 视频剪辑数据库。在视频DB中,搜索有场景变化的特别帧,或搜索包含特别对象的视频帧序列,来跟踪处理运动对象。 存储文本文档集,并处理“在文档集中搜索包含相似主题文档”等有关问题。 以上应用,本质上都要处理相似图像的匹配/识别问题。 * * 5.6.1.4 已建议的空间索引结构综述 建议了许多空间索引结构。 有些索引结构主要是为满足空间数据点检索需要而设计的; 以处理点数据为主的索引结构包括网格文件、hB树、kd树、点四叉树(point quad trees)和SR树。 也有些能自然处理区域数据。而能自然处理区域数据的索引结构则包括区域四叉树(region quad trees)、R树和SKD树等。 * * 5.6.2 网格索引结构(1) 例5.14 设有一个存放顾客购买金首饰记录的关系表(age,salary)。为使问题简化,我们假设该关系只有顾客年龄和月薪两个属性。 ---实例数据中有12个顾客,相关记录被表示成下列的年龄-薪水对:(26,0.6) (45,0.6) (51,0.75) (51,1)(51,1.28)(70,1.30) (85,1.4) (30,2.6) (26,4.0) (45,3.5)(51,2.75)(60,2.6) * * 5.6.2 网格索引结构(2) * * 5.6.2 网格索引结构(3) 网格数组的每个单元(Cell)含有一个指向桶的指针,每个桶可以是一个页或页组,桶中直接存放记录。为了节省空间,网格的多个单元可以指向同一个桶。 网格文件的插入算法 举例:在图5.16网格中,插入记录(70, 3.5K) 。 有关步骤请参见书本 P177-178 网格文件对多维查询支持及性能 对指定点的查找,若无溢出块页,仅需1次I/O; 部分匹配:可能需要查找桶矩阵的某行或某列的所有桶,I/O数可能很大; 范围查询:检查与范围区域有相交的所有桶; * * R-树也是一种平衡树结构,其中被索引的多边形存储在叶节点上(这一点很象B+树)。 每个树节点(叶节点/内节点)都对应有一个平行于坐标轴的矩形边界框。 叶节点 负责存储位于其内的所有被索引多边形,边界框是一个能涵盖其内所有存储对象的最小矩形。 内节点 存储其每个子节点的边界
文档评论(0)