- 1、本文档共99页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2. 机群系统的特点 (1)系统开发周期短 (2)用户投资风险小 (3)系统价格低 (4)节约系统资源 UC Berkeley计算机系100多台工作站的使用情况调查表明,一般单机系统的使用率不到10%,而机群系统中的资源利用率可达到80%左右。 (5)系统扩展性好 (6)用户编程方便 3. 机群系统的关键技术 (1)高效的通信系统在用户空间实现通信协议精简通信协议Active Message通信机制 (2)并行程序设计环境 PVM(Parallel Virtual Machine)开始于1989年夏天,美国橡树岭国家实验室(ORNL);是一套并行计算工具软件,支持多用户及多任务运行;支持多种结构的计算机,工作站、并行机以及向量机等; 传统通信协议 (TCP/IP) 10M Ethernet 100M Ethernet Myrinet 硬件开销 软件开销 通信开销分析 软件开销成为影响通信系统性能的瓶颈 支持C、C++和Fortran语言;自由软件,使用非常广泛;编程模型可以是SPMD或MPMD;具有容错功能,当发现一个结点出故障时,自动将之删除 MPI(Message Passing Interface)在1992年11月至1994年元月产生。 能用于大多数并行计算机、计算机机群和异构网络环境,支持C和Fortran两种语言,编程模型采用SPMD Express美国Parasoft公司推出;能在不同的硬件环境上运行;支持C和Fortran两种程序设计语言。 Linda美国Yale大学与科学计算协会共同研制;通过函数扩充现并行程序的设计;支持C-Linda、Fortran-Linda等 (3)并行程序设计语言在多处理机系统中,必须用并行程序设计语言编写程序。或者把已经用串行语言编写的程序转换成并行语言程序之后,才能在多处理机系统上运行。 把传统串行语言程序转换成并行语言程序的过程称为并行编译。有两种并行编译方式:全自动并行编译与半自动并行编译: 全自动并行编译是方向,但实现起来很困难。 半自动并行编译又称为交互式并行编译。程序员通过多次与机器对话,找到串行程序中可以并行执行的部分。 并行编译器生成代码的形式有多种: 并行高级语言程序、并行中间语言程序、并行目标语言程序 (4) 负载平衡技术 一个大任务可分解为多个子任务,把多个子任务分配到各个处理结点上并行执行的技术称为负载平衡技术 对于由异构处理结点构成的并行系统,相同的负载在各结点上的运行时间可能不同。因此,准确的负载定义应是负载量与结点处理能力的比值 负载平衡技术的核心就是调度算法,即将各个任务比较均衡地分布到不同的处理结点上并行计算,从而使各结点的利用率达到最大。 负载平衡技术分为静态和动态两大类: 静态方法是在编译时针对用户程序的各种信息(任务的计算量和通信关系等)及并行系统本身的状况(网络结构、各结点计算能力等)对用户程序中的并行任务作出静态分配决策。 动态方法是在程序运行过程中实现负载平衡的。它通过分析并行系统的实时负载信息,动态地将任务在各处理机之间进行分配和调整,以消除系统中负载分布的不均匀性。 动态负载平衡的算法简单,实时控制,但增加了系统的额外开销。 (5)并行程序调试技术 用并行程序设计语言编写程序,比用串行程序设计语言更容易出错,因此,在多处理机系统中,用并行程序设计语言编写程序更加依赖于并行调试工具。 并行程序调试的主要困难: 并行程序的执行过程不能重现。 (6)可靠性技术 在多处理机上运行的程序通常比较大,程序执行时间很长(几十个小时或几十天)。如果在程序执行过程中出现偶然故障(如电源掉电、磁盘满、某一台处理机故障等),则整个运算过程要从头开始。 定时设置检查点,保存现场信息。当出现故障时,只要回复到上一个检查点,不必从头开始执行。 曙光5000A 曙光5000A的第一套超大型系统将于08年11月份落户“上海超级计算中心”,该系统的计算节点机采用四路四核AMD Barcelona (主频2.0GHz)处理器,每个节点64GB内存,胖节点机采用八路四核AMD Barcelona(主频 2.0GHz)处理器,每个节点128GB内存,整个系统由1650个节点组成庞大机群,共有6000颗CPU与100T海量内存,其理论浮点峰值为每秒230万亿次,采用20GB,延迟小于1.3us的Infiniband高速网络进行互联,采用了WCCS + SuSe Linux 双操作系统。 从曙光针对5000A的宣传中,我们经常会看到一个比较陌生的词汇——HPP (Hyper Parallel ProCESsing)体系架构。其实目前高性能计算机主流体系系统并没有
您可能关注的文档
- 国际创新调查及在中国和北京的实践讲义.ppt
- 国际化旅游目的地指标体系构建与测评讲义.ppt
- 国际服务外包进口货物保税监管规定和操作实务讲义.ppt
- 国际货物买卖的价格讲义.ppt
- 国际货物买卖中的标的物讲义.ppt
- 国际技术贸易讲义.ppt
- 国际经营中的十项准则讲义.ppt
- 德克士炸鸡店消费需求研究报告讲义.ppt
- 德性与德行讲义.ppt
- 登记立案管辖实务讲义.ppt
- 2025年天津市红桥区中考一模语文试题(含答案)(5).docx
- 2025年上海外国语大学贤达经济人文学院单招职业适应性测试题库完整版(5).docx
- 科龙电器2025-2026审计案例分析.doc
- 关于2025肺炎疫情感人事迹征文学生满分作文.docx
- 重庆市中山外国语学校初2026届地理小题突破训练之世界地理(十四)【word无答案】.doc
- 重庆市中山外国语学校初2026届地理小题突破训练之世界地理(十五)【word无答案】.doc
- 房地产前期部工作制度岗位职责.doc
- 房地产市场调查报告.doc
- 房地产融资管理制度.doc
- 环境微生物学植物毒素系贝类参考实验室iso16140 validation reportISO16140验证报告.pdf
文档评论(0)