网站大量收购独家精品文档,联系QQ:2885784924

SGI UV技术白皮书.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SGI UV技术白皮书

SGI UltraViolet服务器 一、UltraViolet服务器是全球最快的服务器 SGI UltraViolet服务器是SGI最新的NUMAflex体系架构服务器,UV的体系结构和目前广泛应用的Altix4700服务器非常相似,即都是NUMAflex体系结构和全局共享内存,在单一系统影像SSI下支持多个处理器共享内存。 UltraViolet服务器采用的是Intel Xeon Nehalem-EX处理器,单一操作系统最大支持2048核 (4096线程),内存16TB。通过Numalink互联,多台256颗处理器的服务器最大可以扩展到16384个计算节点,32768个处理器,采用8核处理器时,最大核数是262144,提供超过2000万亿次的浮点计算能力。 UltraViolet 服务器NUMAlink5带宽15GB/s,提高了节点之间的带宽,降低了数据传输延迟,MPI延迟1微秒。 根据www.SPEC.org公布的数据显示,SGI UV1000远远领先于其他竞争产品。如图1所示: 图1、运算性能比较 SGI UV1000的高性能还体现在先进的技术和高性能计算软件包,主要有以下几点: 软件主要功能 比较分析 SGI Propack软件包 SGI PropackLinux操作系统之上的针对高性能计算和并行运算的软件包,4大主要功能: Accelerate Applications加速应用Parallel Programming并行编程 Real-Time Performance实时性能 Manage System Resources系统资源管理 Linux操作系统 SGISolve软件包 FFIO(Flexible File IO),提高IO吞吐能力 SGI专利技术,制造行业多种商业软件都可以通过FFIO提高IO性能,不需要对应用软件重新编译 SGI MOE MPI Offload Engine,offload thread synchronization, data sharing and message passing overhead from CPUs—accelerating critical tasks by up to 100xMPI应用,极大提高应用效率 /IP Offload Engine,将CPU从MPI处理中解放出来,从而使整个系统的计算效率提高。使用MOE和没有MOE的性能比较见图2。 SGI Perfboost 通过MOE加速Platform MPI、OpenMPI和Intel MPI应用 SGI PerfboostPlatform MPI、OpenMPI和Intel MPI应用 UV1000 MOE技术,不需要对应用程序进行修改或重新编译。 图2、采用MOE技术与没有MOE技术比较 二、Ultraviolet服务器MPI效率是Infiniband集群的3倍 UltraViolet服务器在其UV-Hub集成电路中增加了MPI Offload Engine (MOE) 功能。MOE的概念和TCP/IP Offload Engine类似,即从系统CPU上卸载TCP/IP协议处理负载。由UV-Hub专用芯片ASICs负责处理MPI通信负载,减轻了系统处理器的工作负荷和内存访问延迟,从而使MPI应用可以扩展到更大数量的处理器。SGI MPT函数库可以利用MOE的优点而不需要对应用程序进行修改。 采用MOE技术,UltraViolet MPI传输性能是普通群集MPP性能的3倍,而且SGI MPT协议是的MPI性能进一步提高。 三、UltraViolet服务器是最平衡的系统 对于大多数HPC应用,内存对提高应用整体性能起着更大的作用。UltraViolet服务器采用Intel新一代的Nehalem-EX 6核或8核处理器,Nehalem处理器提高了Byte/flop比,即提高了系统平衡能力(System Balance),解决了处理器Add/Multiply快,而数据Load/Store慢的所谓”内存墙”(Memory Wall)问题。Nehalem处理器提供内存带宽的关键技术是QuickPath Interconnection (QPI) 和集成的内存控制器。新的Nehalem处理器提供无与伦比的累计内存带宽。根据内存类型、内存配置以及处理器型号,内存带宽在20-25GB/s。 一般的集群系统,处理器峰值高,但是由于获取数据慢,处理器常常处于“无事可做”的状态,

文档评论(0)

cj80011 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档