Parallel-Computer-Architecture并行计算机体系结构Lecture-16.ppt

Parallel-Computer-Architecture并行计算机体系结构Lecture-16.ppt

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Parallel Computer Architecture 并行计算机体系结构 Lecture 16 June 8, 2009 Wu junmin (jmwu@ustc.edu.cn) Overview 关于论文答辩与考试 Review of Lec15 分布式共享存储系统 基于目录高速缓存一致性协议 放松的存储一致性模型 Schedule 6.15 答辩 答辩中每组讲述10分钟,回答问题3分钟,请控制时间(15%误差范围内) 欢迎其他同学提问题,有参与分。 整个答辩:10分,包括:表述+ 回答问题(7分)、参与(3分)。 不参与答辩的同学也可以旁听。 注意:准时参加,请勿交头接耳,尊重自己,尊重别人。 6.30前交论文。电子版(必须) 过期不侯。 考试时间初步定在6月最后一周。 考试形式:开卷考试 Overview 关于论文答辩与考试 Review of Lec15 分布式共享存储系统 基于目录高速缓存一致性协议 放松的存储一致性模型 单一系统映像 单一系统映像SSI(Single System Image)含义: 单一系统:用户把整个机群视为一个单一的系统来使用; 单一控制:系统管理员可从一个单一的控制点配置机群的所有软硬件组件; 对称性:用户可以从任一个节点上获得机群服务; 位置透明:用户不用了解真正执行服务的物理设备的位置。 单一系统映像优点: 终端用户不需要了解应用在哪些节点上运行; 操作员不需要了解资源所在地位置; 降低了操作员错误带来的风险,表现出更高的可靠性和可用性; 可以灵活的采用集中式或分布式的管理和控制,避免了对系统管理员的高要求; 大大的简化了系统的管理,一条命令就可以对分布在系统中的多个资源进行操作; 提供了位置独立的消息通信 单一系统映像关键服务 单一入口点(Single Point of Entry): 单一文件层次(Single File Hierarchy): 单一管理和控制点(Single Point of Management and Control) 单一网络(Single Networking) 单一存储空间(Single Memory Space) 单一作业管理系统(Single Job Management System) 单一用户界面(Single User Interface) 单一进程空间 作业管理系统 作业管理等同于工作负载管理、负载共享或负载管理 在多用户的大型机(Mainframe)中,批作业控制在操作系统之外实现 允许通过管理实现结构化的资源利用计划和控制; 以一种抽象的、透明的、易于理解和易于使用的方式向用户提供了计算资源。 机群作业管理的特点: 对异构环境的支持 批作业支持 并行支持 交互支持 检查点和进程迁移 负载平衡 作业调度问题 负载共享工具LSF(Load-Sharing Facility) LSF由Platform Computing开发,系由Toronto大学开发的Utopia系统发展而来。 侧重对并行和串行作业进行作业管理和负载共享。 支持检查点操作、可用性、负载迁移和单一系统映像。 高度可扩展的,能支持有几千个节点的机群。 已在PC、工作站、SMP、IBM SP2的MPP上的各种Unix和Windows/NT平台上得以实现。目前,LSF已扩展到可支持广域网。 并行文件系统 工作站机群上的文件系统 并行应用一般要处理很大的数据集 I/O系统应该能允许并行应用中协作化的操作。 因此需要设计一个高性能的文件系统来简化进程间的协作,高效地利用所有资源,并且对用户是透明的。 考虑机群系统最基本的两个特点: 大量资源:如磁盘、内存等。 并行存取多个磁盘来提高传输带宽; 利用机群系统中的内存,建立大的文件系统缓冲区来提高性能; 高速互连网络 允许系统依赖远地节点完成某些任务。例如,现在的一些系统依赖远地节点的内存来保存本地节点中放不下的高速缓存块。 软件RAID 软件(逻辑)RAID: 将RAID的思想用在机群中,将数据分布在机群系统的多个磁盘中。 软件RAID表现就象RAID 5,并且与RAID具有相同的优缺点 与RAID的区别,就是文件系统需要负责分布数据和维护容错级别。 条块组(Stripe Group): 将机群系统所有的磁盘组成一个逻辑RAID 向所有磁盘写的大的写操作非常困难,导致很多小写操作。但在RAID 5,小的写操作效率差。因此,系统就不能充分利用所有磁盘的写带宽。 节点的网络连接的带宽有限,不能够同时读/写所有磁盘,只能利用部分磁盘性能。 发生故障的可能性大。奇偶校验机制不够,可能同时多个磁盘故障。 解决方法是将数据条块化分布到磁盘的一个子集上(条块组)。 系统需要执行的小的写操作数目大量减少。 网络连接的带宽与条块组中磁

文档评论(0)

wx171113 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档