基于多维查询云平台高效搜索探析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多维查询云平台高效搜索探析

基于多维查询云平台高效搜索探析    中图分类号:TP 文献标识码:A 文章编号:1007-0745(2013)09-0258-01   摘要:本文提出一个有效的方法来建立一个针对云计算系统的多维索引,把R树和KD树向结合来组织数据记录,提供快速查询进程和有效的索引维护。这种方法能够提供典型的多维查询,包括高效的点查询和范围查询。而且,机器大量数据频繁的改变使得索引的维护成为一个巨大的挑战,并且为了解决这个问题,提出基于索引更新策略的耗费评估,可以有效的更新索引结构。该方法比较综合并独立于基础实施,能够很好的在各种云计算平台上实施。   关键词:云计算 分布式文件系统 节点边界技术   最近,云计算平台作为一个新的数据管理局势,正在得到越来越多的关注。当前有许多云计算产品可以提供各种服务。然而,当前的云平台仅仅支持简单的基于关键字搜索,并且由于缺乏有效的索引技术而不能有效回答复杂索引。   一、网络的发展和云计算的意义   网络正在以一个惊人的速度发展。每天大量数据以数字数据的形式被放在互联网上。很多新的网络应用出现并且他们中的大多数需要处理网络数据的效率,然而,传统的数据管理工具已经不能满足需要。例如,数据库系统软件经常是多重用户的,这就意味着在线网络用户必须同时共享相同的软件资源。当不被期望的尖刻问题出现时,用户可能要面临资源的短缺或是服务质量的下降。所以,可扩展性对未来网络的应用是很重要的需求。在这些环境下,一个新的计算基础设施,云计算,出现了。然而,统一的云计算的定义还没有被确认,它被认为是一场IT业的革命,系统支持云计算根据用户需求动态分配计算资源,存在的云计算系统包括亚马逊弹性计算云,IBM的蓝云和谷歌的映射化简云。采用灵活的资源管理机制并且提供好的可伸缩性,可伸缩的数据结构可以满足云系统用户的需求。云计算系统经常由大量计算机组成,存储大量的数据,并且为成千上万的用户提供服务。在云系统中,资源的分配有典型的可伸缩性,使得每一个用户都感觉自己占有无限的资源。   当前,多数的云实施是基于分布式文件系统。DFS经常使用关键字???储模式来存储数据,在云计算系统中数据时通过关键字对来存储的。当一个搜索到来时,结果数据根据包含的关键字被重新取回。虽然很多有名的云系统使用这个信息存储模式,例如谷歌的GFS和Hadoop的HDFS,他们仅仅为用户提供关键字搜索服务。所以,用户仅仅能通过要点搜索来访问数据,这种访问通过匹配数据来满足口头或数据值。   云计算平台包括成百上千的机器节点,并且他们并行的处理任务和负载。这是云计算基础设施的典型特性。当一个用户提交了一个查询,结果数据被从底层的存储列表和用来并行扫描的一系列分布式进程中取出。没有有效的索引结构支持,搜索进程是很耗费时间的,特别对于复杂的查询。所以,建立更有效的索引结构是一个紧迫的需求。此外,因为在云系统中的大量数据的存在,索引应该能提供高的检索速率。   二、云基础设施建设方案   到目前为止,提出了许多为云基础设施建立有效索引的方案。Aguilera等人为云系统提出了一个可伸缩的分布式B树。其他研究工作人员提出了一个以哈希索引结构为基础的索引。然而,这些索引仅仅能搜索单柱数据。他们不能有效的为多维数据提供有效的查询。   为了在云系统中提供有效的多维数据查询,通过在R树和KD树结合的基础上,提出了一个可伸缩和灵活的多维检索结构。   1、提出了一个有效的和灵活的多维索引结构。使用这种结构能使得典型的和有效的索引有效的执行。索引可以平衡数据容量或簇尺寸增长。   2、提出了一个索引成本评估的更新策略。通过这个策略,可以保证只有在必要和更新的利益被确保的时候,更新才被执行。   通过在装有大量数据的很多机器节点上做了一系列实验。实验证实了索引结构很高效而且有扩展性。通过评价在云计算系统中本文的多维索引的性能和可伸缩性。测试的设施包括六台相连的机器来模拟云计算平台。通信带宽是1Gps。每个机器有主频为2.33GHz Intel Core2处理器,4GB主存,和320G硬盘。作为云平台基本的特性,一个簇包括成百上千个PC机,这些机器负责计算和存储数据。在簇中的机器节点可以分为两类:主节点和从节点。主节点和从节点不是很不同,除了如果机器充当主节点,它将存储整个系统中子节点必须存储的变化数据。从节点存储数据和它们效率和安全的复制。尽管云平台的和客户服务器建构的系统的一个不同点是,云系统不需要中央服务器,它仍然需要一系列机器来维护整个系统的变化数据,这使得很多操作更有效率。在云平台中,客户请求经常与主节点对立起来。在主节点决定哪个从节点和请求相关后,客户将和这些节点直接通信,所以作为一个典型的请求,在云平台中的查询进程被分为两阶段:定位相关节点和在被选

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档