分布式数据库数据分片与分配.docx

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分布式数据库数据分片与分配

关键词:分布式数据库;数据分片;数据分配;分布透明性中图分类号:TP311.133文献标识码:B文章编号:1004373X(2006)1811903AnalysisofDataFragmentandAllocationinDistributedDatabaseYANGJing,LIUTianshi,MAGang(SchoolofComputerScience,Xi′anShiyouUniversity,Xi′an,710065,China)Abstract:Thispapercomparesdistributeddatabasewithcentralizeddatabaseandindicatesdatafragmentandallocationistheimportantaspectindesigningdistributeddatabase.Then,itgivespurposeprincipleandtechniqueofdatafragmentandallo2cation,explainsthetransparencyofdistributeddata,andilluminatestherelationbetweendatafragmentandallocationsimply.Finallyitoutlinessomeproblemsaboutdatafragmentandallocationindistributeddatabasedesign.Keywords:distributeddatabase;datafragment;dataallocation;distributedtransparency个总全局表的逻辑子表,而总全局表是这些子表的并集,其属性包括这些子表的所有属性,元组包括这些子表的所有元组,对应的在这个总全局表上元组的非空值呈块状区域分布。数据分配则是将这些子表以不同的冗余度存放在一个或多个场地或节点,区别在于集中式数据库不存在数据复制的问题,不需要存在多副本,但也会出现表名不同,但表属性和属性值完全相同。1引言分布式数据库系统通过把分布在计算机网络的不同结点或场地,物理上属于多个数据子集,逻辑上属于同一系统之数据集合的海量数据实现数据应用,以实现比集中式数据库系统更好的性能、可扩充性、可用性和自治性[1]。从数据意义上讲,数据分布即数据分片与分配的合理与否或者说合理性的高低,不仅影响着访问的局部性,即尽可能地把用户要求访问的数据就在本结点或本场地,而且也制约着数据查询及事务处理的效率。以关系数据库为例,在关系型分布式数据库系统(RDDB)中,简单地说,数据分片是从逻辑上将全局关系划分为逻辑片断即子关系,而数据分配就是再以一定的冗余度将子关系分配到多个结点上,数据分布即数据分片与数据分配的总和。单纯从数据分布的角度看,集中式数据库系统可以看作分布式数据库系统的一个特例,是集中式还是分布式,最终的目的都是为了使数据可以更好地服务于应用,而数据分片与分配就是达成此目的的方法。数据分片是一种对关系的划分,在集中式数据库中可以将所有的表视为一2数据分片2.1数据分片目的实现对全局关系的逻辑划分,以用户需求为目标,尽可能的提高系统的可用性,适应分布式的事务处理和数据查询。2.2数据分片原则设全局关系R被分片为逻辑片断集合S,Sn},则S满足:={S1,S2,①完整性t∈S,?Si∈S有t∈S。i②不可相交性Πt∈S,1?S有t∈S,i≠j。ijj[2]③重构型存在函数g,使得R=g(S,S,,Sn)。122.3数据分片方法①独立分片Ri=Π(U)(σ(A)(R))orσ(A)(Π(U)(R))U为属性表;A为条件集合;R为关系名;U={U1,收稿日期金项目:陕西省教育厅基金项目(03jk163)U2,,Un};A={A1andA2andandAn}。②关联分片Ri=Π(U)(σ(A)(比较,以客户需求和应用需要为主要目标,选取最适宜的方案。但是这种情况忽略了给定结点存放的逻辑片断或者关系之间存在一定的关联,一种目标的达成有可能造成另外的开销剧增。表1数据分配类型比较R)∞σ(A)(S))。3数据分配3.1数据分配目的通过一定的冗余片断在各结点上的分布,提高系统的可靠性,缩短局部应用的响应时间,尽可能地提高数据的安全性,减少系统的数据通信代价。3.2数据分配准则(1)处理局部性数据分配时应尽量提高数据的局部性,使应用在本结点或相邻的节点处理,以尽可能的减少因为对其他节点数据访问而产生的通信代价。(2)数据可用性和可靠性尽量提高数据只读应用的可靠性,减少因数据检索和更新不同步造成的“脏数据”或“过时数据”。尽可能提高系统的可用性,使系统的管理和存储代价降低。(3)工作负荷分布均匀性使各结点的

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档