并行数据库并行数据库系统.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
并行数据库并行数据库系统

第十章 数据库新进展 10.1 并行数据库 10.1.1 并行数据库系统的体系结构 共享主存储器、共享磁盘、无共享 10.1.2 加速比和扩展性 10.1.3 数据划分 10.1.4 并行处理技术 10.1.5 并行数据库的查询优化 10.1.6 并行数据库与分布式数据库 * 并行数据库系统:对数据库的操作通过多个处理器和磁盘的并行处理实现。 并行数据库主要研究: 数据如何划分、如何分布 并行数据操作算法 并行数据库的查询优化 。。。 磁盘 磁盘 磁盘 共享主存 。。。 处理器 处理器 处理器 互 连 网 络 共享主存储器 共享磁盘 处理器 处理器 处理器 互 连 网 络 磁盘 磁盘 磁盘 存储器 存储器 存储器 …… …… …… 无共享结构 …… 处理器 处理器 处理器 互 连 网 络 磁盘 存储器 存储器 存储器 磁盘 磁盘 …… …… 并行系统常用吞吐量、响应时间衡量系统性能,用加速比和扩展性衡量系统并行效果。 加速比 指数据库系统并行化后处理速度的提高程度。 加速比:TS / TL TS:较小规模并行系统中执行任务T所需要的时间; TL :在较大规模的并行系统中执行同一任务T所需要的时间; 如果二个并行系统的资源比是N,而获得的加速比也是N,则称并行系统实现了线性的加速比。 扩展性 指增加并行度后的处理能力的提高。 扩展性: TS/TL TS :任务T在较小规模系统上的执行时间; TL:在大N倍规模的系统中任务TQ的执行时间; 若TS /TL =1,称对任务T得到的扩展性是线性的。如果TS /TL 1,称扩展性为准线性。 影响加速比和扩展性的主要因素 启动代价、干扰和偏斜(skew)。- 影响加速比和扩展性的主要因素 启动代价:多进程多线程,启动进程的代价 干扰:共享资源竞争 偏斜(skew):子任务划分的偏斜 并行系统中,一个关系分为多个分片存储在不同磁盘上,划分策略是均衡负载,主要方法有: Round-robin法 关系中元组随机、均匀分布在多个磁盘上. 要找出特定属性值需要并行扫描所有磁盘. Hash法 按照划分属性的散列值确定存储元组到不同磁盘上. 在划分属性上的查询可定位在一个磁盘上. range法 按划分属性值的范围分片后分布在不同磁盘上. 系统的并行执行可在不同的粒度上进行,形成了不同的并行处理技术。 事务间的并行 不同查询或不同事务间的并行执行。 利用锁机制协调不同处理器读出的数据是一致的。 事务内操作间的并行 一个查询内不同操作间的并行。 流水线并行 r1 r2 r3 r4 独立并行 r1 r2 r3 r4 操作内的并行 并行排序 (例:对关系R排序) 多路归并排序 并行连接 (例:对关系S和SC连接,学号) 参加连接关系按照连接属性值划分或散列到相同磁盘上,然后并行执行连接。 并行选择 相等选择、范围选择 并行投影 并行数据库的查询优化特点:可利用的资源多,可选择的执行方案多。 代价=CPU + I/O + 通信代价 查询优化目标 尽量能使操作并行,减少响应时间 优化策略 启发式优化方法,减少收索空间 连接执行方法的选择 资源合理分配 r3 r4 r1 r2 右线性树 应用目标不同 PDB 尽量并行执行数据库操作,提高系统整体性能 DDB 场地自制、数据操作的透明性 实现方式不同 PDB 充分利用结点处理能力,均衡负载 DDB 尽量减少结点间数据传输,减少通信代价 结点地位不同 PDB 不存在全局和局部应用,结点间协同工作 DDB 除了结点间协同完成全局应用外,各个结点是高度局部自制的。 * *

文档评论(0)

wangyueyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档