第五章分布式数库概述.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章分布式数库概述

第五章 分布式数据库概述 数据库系统发展 集中式系统 为什么需要分布式系统 分布式数据库体系结构的目标 并行与分布式数据库系统 分布式数据库的问题 分布数据独立与分布透明访问 数据库系统发展 基于数据模型 数据结构, 操作 层次, 网状, 关系, OO, 时态, 空间, 图, 时空, 文本, 工程, 生物, 地理, 图像数据库等 基于运行环境 集中式, 分布式, 并行, Cluster, Web, 移动, 嵌入, 数据网格等数据库 主动, 实时数据库等 事务处理 数据库系统 数据库-可以存储长时间的信息集合 数据库管理系统-允许用户使用专门的数据定义语言和操作语言, 支持超大数据量数据的长时间存储,并能正确控制多个用户对数据的立即存取的软件 用户- 包括DBA, 终端用户, 应用程序员等 集中式数据库系统 软件: 分布式数据系统 定义: 物理上分散而逻辑上集中的数据库系统. 特点 物理分布性 数据不在单个Site上, 按全局需求将数据划分成一定的数据子集, 分散存储在各个Site上. 逻辑整体性 各个Site上的数据子集, 相互间有严密的约束规则加以限定, 逻辑上是一个整体. 站点自治性 各个Site上的数据(即LDB)是有本地的DBMS管理, 具有自治处理能力. 为什么需要分布式数据库 举例: 某大公司分别在 London, New York及 北京有分公司. 职工数据: EMP(ENO, NAME, TITLE, SALARY, …) 问题: 该职工数据表数据应该如何存储 职工数据的访问方式 大多数情形, 职工数据被其服务的各分公司管理 E.g. 工资, 福利, 聘用与解聘 定期地, 总公司统一地访问职工数据 E.g. 总公司修改影响所有职工的利益计划 E.g. 根据公司的全体净利润, 销售确定年终分红与公司发展计划的等 异构与自治 选择新的投资 同构型(Homogeneous) 各个Site上的DB数据模型相同, 进一步可分为 同构同质型 和 同构异质型 异构型(Heterogeneous) 各个Site上的DB数据模型不同. 集中型 DDB的全局控制信息位于一个中心Sie上 分散型 每个Site上包含有全局控制信息的一个Copy 可变型 DDB分成两组, 一组Site包含全局控制信息Copy(主Site), 另一组不含全局Copy(辅Site) 因此, 分布式数据库是要考虑在具有多处理器并可能是自治,异构情况下的数据管理 受影响的内容有: 数据组织 查询处理 存取结构 并发控制 恢复处理 分布式数据库体系结构的目标 可伸缩性 可用性 负载平衡 易于编程 分布式体系结构 (1) 共享内存 分布式体系结构-续 (2) 共享磁盘 分布式体系结构-续 (3) 不共享 DDB 体系结构 四层结构 选择体系结构的其他因素 数据的地域分布 数据 “聚类” 代价 并行与分布式DB系统 相似性大于差异性! 并行DB 高速连接 同构软件 高性能与透明是其主要目标 分布式DB 地域分布 数据共享是目标 (可以运行在异构, 自治环境) 操作可能不连惯 分布式数据库的问题 分布式DB设计 决定什么数据存放在何处 依赖于主要应用的访问方式 两个子问题: 分段(Fragmentation): 将表分割成段 分配(Allocation): 将段放置到站点 分布式数据库的问题 分布式查询处理 集中式查询计划的目标: 极小化磁盘 I/O 分布式情形还要考虑: 通讯代价 并行处理的可能性 可能存在的查询计划空间大于集中式查询计划空间! 分布式数据库的问题 分布式并发控制 事务跨越多个站点 必须是全局可串 两种主要技术: Locking Timestamps 分布式死锁管理 数据多副本 – 更新时需要保持同步 分布式数据库的问题 分布式数据库的可用性 集中式的故障模型: 处理器故障 分布式的故障模型: 一个或多个处理器故障 网络故障 网络分割 数据必须保持同步 分布式数据库应用举例 假定在广州的用户给出如下查询:采摘葡萄地区的降雨量Rain1700mm的葡萄酒的名字,年份,及采摘区的日照信息. 已知 wine(year, name, producer, area, country) weather(year, area, country, sun, rain) 另已知 wine表数据根据其country值分别存放在巴黎, 罗马, 旧金山. Weather表数据分拆为weather-R(year, a

文档评论(0)

l215322 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档