.11章_分布式数据库系统的发展趋势_.pptVIP

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
.11章_分布式数据库系统的发展趋势_

分布式数据库系统及其应用;并行数据库服务器与分布式数据库系统 分布式知识库系统 分布式面向对象数据库;70年代的数据库机, 现代的数据库服务器 数据库服务器的优势 功能专一 专用OS, DBMS与OS紧耦合, 提高DBMS的总体性能 适于现实世界的分布环境 充分利用先进的硬件体系结构 缺点 额外的通信开销 因此要求服务器提供较高层次的接口, 关系模型操作是面向集合的操作, 所以成为服务器模型的首选;用户;集中式服务器结构 明确分工, 减少工作站与服务器之间的通信 工作站对语言预处理(完整性检查, 安全控制) 工作站能访问数据目录 服务器管理和更新目录, 工作站只读目录 优化DBMS和OS(软方法), 或者使用多处理机(硬方法)解决服务器瓶颈问题;接口;分布式服务器结构 两种查询处理方式 数据查询先提交到本地服务器,由其负责所有的分布式查询处理 每个应用服务器上也都可以由分布式查询处理器和数据目录操作器,直接访问远程数据服务器;数据服务器专门用于分布式和集中式数据库管理 在传统机器结构上,在分布式OS上执行DBMS和分布式DBMS 基于特定计算机系统结构实现分布式数据库操作系统;DB;冯.诺依曼型计算机结构的局限 不能发挥应用中普遍存在的内在的可并行处理特性 关系操作本身的可并行性, JOIN中的多个子查询, 单个查询中的多步操作 数据库管理性能受到I/O瓶颈的影响 内存速度比硬盘速度快1000倍 增加带宽提高磁盘存取的并行性 使用并行可存取的多个小磁盘;多处理机结构 通过高速通信介质连接多个可独立处理的单元 通过分配,查询 操作和子操作到不同的处理单元, 以并行执行方式完成互连查询, 内部查询, 及各种内部操作 ;类型 完全共享资源结构 对每个数据项的存取都要经过公共通信线路,引起通信瓶颈 类似于集中式DBMS,差别是数据库操作可以并行处理 完全不共享资源结构 高功能计算机系统可以由多个较小的系统替代 每个站点都要实现全局数据目录,分布数据定义和控制,分布查询处理和分布式事务管理 站点不能运行应用程序;处理机1;处理机1;并行数据服务器数据定位 类似于分布式数据库中的数据片段定位 分簇(Declustering) 数据的水平分片 提高响应速度和内存查询并行度 聚簇(Clustering) 聚集关系的片段 综合查询或减少系统总体运行代价 程序应在数据存储的站点上运行 DDBS中DBA根据对片段的使用情况检测, 进行调整, 包括移动片段和重组。;并行数据服务器与DDBS的不同 应用目标不同 并行中用户不专门使用某个站点, 所以不要求最大化本地性处理 实现方式不同 站点间高速网互连, 传输代价小, 可以调节站点间工作负载 各站点地位不同 不存在全局应用和局部应用 各站点完全不独立, 处理时只能发挥协同作用, 无局部应用;数据定位方法 全分簇:片段分布到系统中所有有磁盘的站点 散列算法分片:查询时, 与选择属性精确匹配的子查询得以在一个站点上处理, 所有其它子查询在其他站点处理, 适于大范围多用户工作负载 但复杂查询(多个连接)时, 聚簇方法较好 可变分簇 依据“分簇度”对关系分片 分簇度是关系数据分片的站点数量, 是关系大小和存取频率的函数 这种方法比聚簇和分簇更加复杂,因为数据分布的改变可能导致结构调整 ;关联查询 传统系统中,关联存取是由查询处理器在编译时利用数据目录完成 并行系统中, 采用“全局索引”复制到每一个站点 全局索引 能确定关系在各站点分布的二级索引 主聚簇:关于关系名 次聚簇:关于关系中的某些属性 基于散列法或B树实现;例: 工程数据库 E(ENO, ENAME, DEPT, TITLE) S(TITLE, SAL) J(JNO, JNAME, BUDGET) G(ENO, JNO, RESP, DUR) 全局索引(查询ENO=‘E5’) 第一级关于关系名索引映射到E关系的ENO属性索引 第二级索引进一步映射值E5到站点j;关于关系名的索引;本地索引(次簇索引) 映射一个关系到站点的一组磁盘块上 类似于全局索引 第一级关于关系名 第二级关于属性索引(映射簇值E5到91磁盘块) 实验结果 短事务负载下, 分簇数量增加, 事务吞吐量增加 多连接复杂事务负载下, 太细分簇降低吞吐量;关于关系名的索引;基于逻辑的数据库 逻辑数据库, 推理数据库, 专家DBMS, 演绎DBMS, 知识库等 知识库 存储常用知识的内涵数据库和存储事实的外延数据库的联合体 内涵数据库 公理(命题)和规则等 外延数据库 基本数据;知识表示 产生式规则 框架(Frames) 语义网络(Semantic Net) 数学逻辑 知识库语言 Prolog D

文档评论(0)

maxmin + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档