一种P2P数据库的实系闹机制.docVIP

下载本文档

0
0
约 7页
2017-08-19 发布于湖北
举报
版权申诉

一种P2P数据库的实系闹机制.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种P2P数据库的实系闹机制

一种P2P数据库的实现机制摘要基于DHT的结构化P2P网络具有鲁棒性、自适应性、可用性、负载均衡等特点，但缺乏表示和管理复杂语义数据的手段，在P2P数据库中引入复杂数据的索引和定位机制成为系统的关键。本文以结构化的DHT P2P网络作为分布式平台，探讨一种P2P数据库的实现机制。主要使用数据复制和分层索引机制来保证高效的实现资源定位，并且避免了Hash对数据语义的破坏，使系统有效地保持数据语义间的联系。关键字 P2P数据库；资源定位；数据复制1 引言 Peer-to-Peer(P2P)环境下的数据管理和共享是数据库领域的研究热点，焦点问题集中在如何使得P2P支持复杂语义数据管理功能，提供数据资源复制、索引和精确的资源定位机制。基于P2P数据管理系统PeerDB[3]，UC Berkeley大学的PIER[5]，Edutella[7]，Pizaa[2]，这些系统不同程度实现了数据共享。PeerDB基于关键字模式映射很难做到准确性，需要过多人为管理； PIER引入名称空间(Name Space)对数据进行索引，但仅仅支持关键字精确匹配查询。Edutella利用超节点描述其辖域子节点共享资源，超节点容易成为瓶颈，不利于系统的扩展。本文以结构化DHT P2P 网络Chord[1]作为分布式平台，探讨一种广域网环境下P2P数据库的实现机制。首先，对数据使用规则进行分割，并复制到网络中去，提高系统的可靠性和处理的并行性；为避免Hash对数据语义的破坏，利用元数据对副本进行标识、索引；最后，把这些索引元数据组成一种分层索引机制使得数据请求节点可以高效地进行资源定位。2 P2P数据库体系结构传统分布式数据库在局域网环境下，提供全局视图使得用户可以透明地访问数据库，局部数据源之间有较高的耦合度。但是P2P数据库是基于动态广域网，并且不存在中心控制节点，要在这样的环境中提供全局视图是不现实的。P2P 数据库系统不存在全局视图，但是，提供一组映射规则和索引机制实现数据定位和数据访问。 P2P数据库是局部数据库LDB，P2P网络及协调规则三者的统一体lt;LDB，P2P，Coordinationgt;，其中LDB管理局部数据，包括共享数据部分和私有数据部分；P2P网络提供Peers间的通信、路由及数据传递；协调规则由一组映射组成，协调各LDB合作为用户的请求提供数据服务。 P2P 数据库系统体系结构(如图1所示)包括四层：应用层、数据管理层、P2P网络层和局部数据库层。图1 P2P数据库体系结构3 一种P2P资源定位机制本文主要使用数据复制和分层索引机制来保证高效的实现资源定位，并且避免了Hash对数据语义的破坏，使系统有效地保持数据语义间的联系。首先，对数据使用规则进行分割，并复制到网络中去，提高系统的可靠性和处理的并行性；为避免Hash对数据语义的破坏，利用元数据对副本进行标识、索引；最后，把这些索引元数据组成一种分层索引机制使得数据请求节点可以高效的进行资源定位。3.1 数据复制首先把关系表进行分割，然后把这些关系表子集及其标识信息(作为元数据)复制到节点中去。基于关系子集的复制粒度，同时使用标识其定位信息，既可以保持关系表的整体性，又可以快速实现资源快速定位。系统中数据复制的粒度为关系表，或关系表的子集，具体过程如下：对关系R的分割要使用一些规则集合，可以使用某一条规则把R分割为；对每一个子集Ri使用进行标识；把副本及其定位元数据复制到网络中；关系表是其元组集合)，对R利用规则集合进行分割后得到一系列子集{R1,R2,…RK} (klt;N)。依据Chord路由算法，每一个节点peer可以直接与其指针表指向的节点直接通信，本文把这些节点称作该节点的Link_Peer （Link_Peer＝{peer，LP1，LP2，...LPm}），需要注意的是Link_Peer是包括该节点peer的。对节点peer的数据R，其副本{R1,R2,…RK}只能分布到Link_Peer上，对于特定的副本分布到Link_Peer的哪个节点上，没有特定的规定，他们的机会是均等的，可以认为是随机的。图2 元数据放置策略LDB，RID和rl形成了一个层次状的域名空间（rl决定的数据挝RID标识的数据LDB）。这样实际上形成了一个分层索引机制，为资源定位提供了方便。3.2 资源定位根据用户数据请求，资源定位为该请求服务定位到存储相关副本的节点，由该节点执行局部操作。由3.1节可知，数据副本定位元数据放置到Successor(RID)节点上，同一关系表有相同的RID，那么关系表R的所有副本定位元数据均存储在Successor(RID)节点上。某一特定数据请求操作具有空间局部性，这种元数据放置策略使得只需在某几个节点搜索定位元数据即