浙江大学冷冻电镜中心高性能计算集群介绍-浙江大学冷冻电镜中心门户.PDFVIP

  • 215
  • 0
  • 约2.57千字
  • 约 3页
  • 2019-08-18 发布于北京
  • 举报

浙江大学冷冻电镜中心高性能计算集群介绍-浙江大学冷冻电镜中心门户.PDF

浙江大学冷冻电镜中心高性能计算集群介绍-浙江大学冷冻电镜中心门户.PDF

浙江大学冷冻电镜中心 高性能计算集群介绍 集群采用AMAX GPU 服务器和联想CPU服务器组合成一个高性能异构计 算集群,满足整体架构要求。其中联想刀片服务器作为集群的CPU计算节点, AMAX机架式服务器作为集群的GPU计算节点。仪器产生的数据通过万兆交换 机网络连接至IO节点,最终保存到后端存储。 用户通过管理登录节点提交作业,计算节点从IO节点读取后端存储数据进 行并行计算,其结果将被保存至I/O节点,通过I/O节点放置到后端存储中。同 时,配备3D效果显示工作站用于远程操作。 该异构集群资源调度使用Platform LSF作业调度系统,集群管理软件安装 在管理节点上,用来负责整套系统的任务分配及各个节点的健康状态。 集群的计算网络使用高速的,无阻塞的56Gb/s infiniband网络,管理网络 使用千兆以太网网络,整套系统使用双网独立的形式以避免管理网络与计算网 络之间的冲突。详见如下拓扑图:  高性能计算平台分为 6 个子系统:计算子系统、管理登陆子系统、 网络子系统、存储子系统、软件子系统及3D 高性能工作站。其中,计算子 系统包含15 个GPU 计算节点,38 个双路CPU 计算节点,平台理论总峰值 性能达到每秒 128.638 万亿次(TFlops )的浮点运算。存储子系统配置 648 TB NL SAS 磁盘。3D 高性能工作站共12 台。 GPU 节点组成: 10 台AMAX 的高性能服务器PSC-HB1X ,每个台配置2 颗Intel Xeon E5-2637v4 处理器、4 块Nvidia GTX-1080TI,11GB显卡、256G DDR4 2400MHz 内存和4 块800G MLC SSD 硬盘; 3 台AMAX 的高性能服务器PSC-HB1X ,每个台配置2 颗Intel Xeon E5- 2637v4 处理器、4 块Nvidia Tesla P100 ,16GB 显卡、512G DDR4 2400MHz 内存和4 块800G MLC SSD 硬盘; 2 台AMAX 的高性能服务器PSC-HB1X ,每个台配置2 颗Intel Xeon E5- 2637v4 处理器、2 块NVIDIA Quadro GP100 ,16GB显卡、512G DDR4 2400MHz 内存和4 块800G MLC SSD 硬盘; 1 台IBM 高性能服务器 POWER ,每个节点配置2 颗 8 核 3.259 GHz POWER8 处理器、4 块Nvidia Tesla P100 ,16GB 显卡、512G DDR4 2400MHz 内存和2 块 480GB MLC SSD 硬盘。所有节点集成双口千兆网口及 56GB Infiniband HBA 卡。 CPU 节点组成: 34 台联想SD530 服务器,每个节点配置2 颗Intel Xeon Gold 6140(2.3GHz , 18 核 36 线程)、256GB DDR4 2666MHz ECC RDIMM 内存、1 块 300GB 12Gbps 10Krpm SAS 硬盘; 3 台联想SR630 服务器,每台配置2 颗Intel Xeon Gold 6140 (2.3GHz , 18 核 36 线程)、512GB DDR4 2666MHz ECC RDIMM 内存、1 块 300GB 12Gbps 10Krpm SAS 硬盘; 1 台联想SR630 服务器,每个节点配置2 颗Intel Xeon Gold 6128(3.4GHz, 6 核12 线程)、768GB DDR4 2666MHz ECC RDIMM 内存、1 块 300GB 12Gbps 10Krpm SAS 硬盘。每台服务器配置2 个1Gb 以太网口及2 个56Gb InfiniBand FDR 端口。  存储子系统:联想数谱DS5760 集中存储,配置648 TB NL SAS 磁盘,96GB 高速缓存,

文档评论(0)

1亿VIP精品文档

相关文档