21_深腾1800并行计算.pptVIP

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
并行计算 与 联想深腾1800系列机群系统 联想高性能服务器事业部 2003年3月 1. 理论科学 2. 实验科学 3. 计算科学 计算力学、计算生物学、计算化学、计算气象学、计算材料学、计算物理学、计算流体力学、计算电子学、计算分子动力学、 串行程序的发展阻碍 物理速度渐变发展 芯片速度每18月加快一倍 内存传输率每年加快9% 物理极限无法突破 芯片晶体管接近原子极限 传输速度不可能突破光速 计算速度如何提升? 优化设计层次 问题定义 系统结构 算法 数据结构 代码调优 系统软件 系统硬件 软件代码调优 汇编指令级 内部函数 向量类库 多线程 循环转化 编译器及参数 性能库 并行计算 并行机的发展 向量机(超级计算机): CRAY, 银河I SMP(小型机): IBM , 690SUN,联想深远 MPP(大规模并行机): T3E,曙光1000 ccNUMA(分布共享存储机): SGI Qrigin 机群系统:联想深腾1800, IBM SP 机群服务器异军突起 主流CPU性能对比 推广普及 并行计算 并行计算 并行算法设计 PRAM模型、BSP模型、logP模型、C3模型 功能设计、分治设计、平衡树设计、倍增设计 划分、通信、组合、映射 并行程序开发 SIMD、MIMD、SPMD、MPMD 向量、共享、分布、机群…… 负载平衡、任务调度、选路方法、开关技术…… 并行化分解方法 任务分解 多任务并发执行 功能分解 分解被执行的计算 区域分解 分解被执行的数据 并行计算运行模式 相并行 分治并行 流水线并行 主-从并行 工作池并行 相并行模式 分治并行模式 流水线并行模式 主-从并行模式 工作池并行模式 常规并行方式 任务并行 不同参数的大量工况计算 区域分解并行 大规模多节点分块并行计算 联想机群操作系统 用户应用 并行程序设计模型 数据并行 HPF、Fortran90 共享存储并行 OpenMP、Pthreads 消息传递并行 MPI、PVM 航天部701所串行程序并行化 计算流体力学程序 数值求解Navier-Stokes方程 均匀网格空间离散 二阶中心差分格式 时间方向显示推进 总代码量5000多行 联想代工式并行化开发 计算流程及空间离散 空间离散分块并行 并行计算流程 并行计算结果 联想服务 软件调优培训 从汇编到编译器、高性能库的全系列调优技术 并行计算培训 并行计算;MPI、OpenMP并行程序开发 辅助式并行化开发 手把手帮助用户开发并行应用 代工式并行化开发 用户给联想串行程序, 联想给用户并行程序! 深腾1800当前支持的并行版软件 石油: OMEGA、Promax、Focus CAD/CAE: Ansys/ls-dyna 、MSC.Marc 、MSC.Dytran 、 MSC.Nastran 汽车碰撞分析:ESI、 气象/环境: MM5、 ccm3 、LASG/IAP、ARPS、Regccm2 计算流体力学:Fluent、 计算化学:Gauss98/2000、NWChem 生物/医学:SRS、phrap、blast、fasta、repeat-masker、cross_match、emboss 更多软件:NAMD、EGO、CPMD、VASP、FIDAP、IMSL…… 科学研究方法 科研 工作者 计算机 软件工程师 计算机 硬件工程师 开发维护更困难 开发维护更容易 下一步 ? 机群结构 1048 2444 5600 2.8 GHz P4 XEON Intel 1431 3534 4000 1 GHz Itanium2 Intel 1200 2100 4500 2500 5800 Peak (Mflops) 499 1106 600MHz MIPS SGI 711 1076 1050MHz UltraSparc Sun 782 1929 2250MHz Athlon2800+ AMD 1019 1945 1250MHz Alpha HP 1221 3245 1.45GHz Power4 IBM Specfp 2000Base TPP n=1000 Clock CPU Manufacturer 下一步 ? 串行程序并行化! 提供给用户一个虚拟的大型机环境 简化用户工作,自动实现任务并行 1.0 840 1 7.3 115 8 9.6 87 16 17.4 49 32 加速比 索引所用机时 (分钟) 节点数量 微生物所:GENBANK索引建立的计算 主进程 航天部701所计算流体力学程序 串行程序并行化 1.97 22.5 2 15.16 2.928 16 (8节点) 7.93

文档评论(0)

yyh892289 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档