- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高性能计算机研究的现状与展望
樊建平 陈明宇
摘要 高性能计算机的研制受永无止境的探求复杂的物理世界与人类社会本身的应用计算需求的驱动及研
制者所处环境(人员、经验、经费等)及当时的可选择的实现使能技术的影响。回顾历史,任何时刻研制
的最高性能的计算机总是服务于当时的科学计算的需求(材料模型、药物设计、气候模拟、核武器模拟、
电磁学等)或者称是以科学计算为最初应用的靶子进行设计的(当前最快的日本Earth Simulation 与 IBM
BLUE/Gene 两个项目是很好的例子),而高性能计算机使用与发明的技术逐步向商用领域转移与转化
(SMP、MPP、Cluster 等),计算性能(当前的设计目标是 Petaflops )及与其相匹配的存储、带宽等指
标成为高性能计算机设计者追求的持续性关键指标。高性能计算机的实现使能技术包括计算数学(计算模
型与算法)、计算机体系结构与部件构成技术三部分,为保持每十年性能增加 700-1000 倍左右的速度(远
高于摩尔定律单芯片的发展速度)及高性能计算能力 70%的年增长需求,高性能计算机设计师仅仅考虑体
系结构与部件构成两部分已不能满足现实的需求,对计算数学有相当的了解已成为必然。本文以性能为叙
述主线,介绍高性能计算机研制的历史、现状与未来展望。
1 高性能计算机研制的历史回顾
1.1 1950-2002 历史的简单回顾
电子计算机在诞生之初主要就是为科学计算服务的。到 1960 年代,随着技术的成熟,计
算机开始走向各种商业领域的应用,并且应用范围越来越广泛。因此,为了有别于“通用计
算机”,专门针对科学计算进行优化设计的计算机开始被称为“高性能计算机”,或简称 HPC。
可以把 1970 年代出现的向量计算机看作是第一代的高性能计算机。通过在计算机中加入
向量流水部件,可以大大提高科学计算中向量运算的速度,其中比较著名的有CDC 系列、
CRAY 系列、NEC 的 SX 系列向量机。中国有代表性的是银河一号及中科院计算所的 757
计算机。
80 年代初期,随着 VLSI 技术和微处理器的技术的发展,向量机一统天下的格局逐渐被
打破。通过多个廉价的微处理器构建的并行化超级计算机首先从成本上具有了无可比拟的优
势。“性能/价格比”而非单一性能成为衡量高性能计算机系统的重要指标。按照摩尔定律速
度发展的微处理器的性能快速超越传统向量机。1990 年代初期,大规模并行处理(MPP )
系统已经开始成为高性能计算机发展的主流。
MPP 主要由多个微处理器通过高速互联网络构成,每个处理器之间通过消息传递的方式
进行通讯和协调。比较有代表性的有 TMC 的CM-5, Intel Paragon 等。中国的第一个 MPP 系
统是计算所国家智能机中心的曙光 1000 计算机。
较 MPP 早几年问世的对称多处理机 SMP 系统,是由数目相对较少的微处理器共享物理
内存和I/O 总线形成的计算机系统(国内最早基于微处理器的 SMP 为曙光 1 号)。和 MPP 相
比,早期的 SMP 扩展能力有限,并不具有很强的计算能力。但由于 SMP 与单机系统兼容性
好,是单机系统的升级与增强,被广泛应用于商业计算领域。
1990 年代中后期的一种趋势是将 SMP 的优点和MPP 的扩展能力结合起来,这一趋势发
展成后来的 CC-NUMA 结构,即分布式共享内存。每个处理器节点都可以访问到所有其它
节点的内存,但访问远程内存需要的延迟相对较大。代表性的系统有 Sequent NUMA-Q,
SGI-Cray Origin 等,国内的神威与银河系列等。CC-NUMA 本身没有在提高性能的角度上进
行较大的创新,主要优点是便于程序的开发和与 SMP 的兼容性。而对科学计算任务
CC-NUMA 结构是否优于 MPP 系统仍存在争议。
在发展 CC-NUMA 同时,机群系统(Cluster )也迅速发展起来。类似 MPP 结构,机群
系统是由多个微处理器构成的计算机节点通过高速网络互连而成。节点一般是可以单独运行
的商品化计算机。由于规模经济成本低的原因,机群系统具有比MPP 更高的性能/价格比优
势。机群系统还继承 MPP 系统的编程模型,更进一
文档评论(0)