.11章_分布式数据库系统的发展趋势_.pptVIP

下载本文档

3
0
约 32页
2017-05-02 发布于山西
举报
版权申诉

.11章_分布式数据库系统的发展趋势_.ppt

1、本文档共32页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

.11章_分布式数据库系统的发展趋势_

分布式数据库系统及其应用;并行数据库服务器与分布式数据库系统分布式知识库系统分布式面向对象数据库;70年代的数据库机, 现代的数据库服务器数据库服务器的优势功能专一专用OS, DBMS与OS紧耦合, 提高DBMS的总体性能适于现实世界的分布环境充分利用先进的硬件体系结构缺点额外的通信开销因此要求服务器提供较高层次的接口, 关系模型操作是面向集合的操作, 所以成为服务器模型的首选;用户;集中式服务器结构明确分工, 减少工作站与服务器之间的通信工作站对语言预处理(完整性检查, 安全控制) 工作站能访问数据目录服务器管理和更新目录, 工作站只读目录优化DBMS和OS（软方法）, 或者使用多处理机（硬方法）解决服务器瓶颈问题;接口;分布式服务器结构两种查询处理方式数据查询先提交到本地服务器，由其负责所有的分布式查询处理每个应用服务器上也都可以由分布式查询处理器和数据目录操作器，直接访问远程数据服务器;数据服务器专门用于分布式和集中式数据库管理在传统机器结构上，在分布式OS上执行DBMS和分布式DBMS 基于特定计算机系统结构实现分布式数据库操作系统;DB;冯.诺依曼型计算机结构的局限不能发挥应用中普遍存在的内在的可并行处理特性关系操作本身的可并行性, JOIN中的多个子查询, 单个查询中的多步操作数据库管理性能受到I/O瓶颈的影响内存速度比硬盘速度快1000倍增加带宽提高磁盘存取的并行性使用并行可存取的多个小磁盘;多处理机结构通过高速通信介质连接多个可独立处理的单元通过分配，查询操作和子操作到不同的处理单元, 以并行执行方式完成互连查询, 内部查询, 及各种内部操作 ;类型完全共享资源结构对每个数据项的存取都要经过公共通信线路，引起通信瓶颈类似于集中式DBMS,差别是数据库操作可以并行处理完全不共享资源结构高功能计算机系统可以由多个较小的系统替代每个站点都要实现全局数据目录，分布数据定义和控制，分布查询处理和分布式事务管理站点不能运行应用程序;处理机1;处理机1;并行数据服务器数据定位类似于分布式数据库中的数据片段定位分簇(Declustering) 数据的水平分片提高响应速度和内存查询并行度聚簇(Clustering) 聚集关系的片段综合查询或减少系统总体运行代价程序应在数据存储的站点上运行 DDBS中DBA根据对片段的使用情况检测, 进行调整, 包括移动片段和重组。;并行数据服务器与DDBS的不同应用目标不同并行中用户不专门使用某个站点, 所以不要求最大化本地性处理实现方式不同站点间高速网互连, 传输代价小, 可以调节站点间工作负载各站点地位不同不存在全局应用和局部应用各站点完全不独立, 处理时只能发挥协同作用, 无局部应用;数据定位方法全分簇：片段分布到系统中所有有磁盘的站点散列算法分片：查询时, 与选择属性精确匹配的子查询得以在一个站点上处理, 所有其它子查询在其他站点处理, 适于大范围多用户工作负载但复杂查询(多个连接)时, 聚簇方法较好可变分簇依据“分簇度”对关系分片分簇度是关系数据分片的站点数量, 是关系大小和存取频率的函数这种方法比聚簇和分簇更加复杂，因为数据分布的改变可能导致结构调整 ;关联查询传统系统中，关联存取是由查询处理器在编译时利用数据目录完成并行系统中, 采用“全局索引”复制到每一个站点全局索引能确定关系在各站点分布的二级索引主聚簇：关于关系名次聚簇：关于关系中的某些属性基于散列法或B树实现;例: 工程数据库 E(ENO, ENAME, DEPT, TITLE) S(TITLE, SAL) J(JNO, JNAME, BUDGET) G(ENO, JNO, RESP, DUR) 全局索引(查询ENO=‘E5’) 第一级关于关系名索引映射到E关系的ENO属性索引第二级索引进一步映射值E5到站点j;关于关系名的索引;本地索引(次簇索引) 映射一个关系到站点的一组磁盘块上类似于全局索引第一级关于关系名第二级关于属性索引(映射簇值E5到91磁盘块) 实验结果短事务负载下, 分簇数量增加, 事务吞吐量增加多连接复杂事务负载下, 太细分簇降低吞吐量;关于关系名的索引;基于逻辑的数据库逻辑数据库, 推理数据库, 专家DBMS, 演绎DBMS, 知识库等知识库存储常用知识的内涵数据库和存储事实的外延数据库的联合体内涵数据库公理(命题)和规则等外延数据库基本数据;知识表示产生式规则框架(Frames) 语义网络(Semantic Net) 数学逻辑知识库语言 Prolog D