中国科学院上海硅酸盐研究所高性能陶瓷和超微结构国家重.docxVIP

中国科学院上海硅酸盐研究所高性能陶瓷和超微结构国家重.docx

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国科学院上海硅酸盐研究所高性能陶瓷和超微结构国家重点实验室,计划对原有的联想高性能计算集群进行升级和扩容,以满足科研工作对HPC计算能力不断增加的需求。重点实验室现有的联想深腾高性能计算集群有17个节点,包括1台管理节点(联想万全R520 服务器),16台计算节点(联想万全R510 服务器),1台24端口千兆交换机,1台Qlogic 12200 Infiniband 40Gb 36端口高速交换机,2套SANTAK UPS不间断电源(C6K和C10K各1台)。 本次联想深腾高性能计算集群扩容升级,在原有HPC集群基础上组建一个集群统一管理、资源统一调度的更大规模的高性能计算集群,要求技术指标如下:序号设备名称技术规格单位数量1计算节点联想Lenovo ThinkServer RD540服务器:每台配置2颗Intel Xeon E5-2670v2 CPU(2.5GHz/10-core),8GB*8 RDIMM DDR3 1866MHz内存 共64GB,1块300GB 10KRPM 热插拔SAS磁盘2.5寸,集成2个千兆以太网络端口, 800W热插拔1+1冗余电源模块,配置1块Intel TrueScale 40Gb IB QDR InfiniBand HCA卡;原厂商三年免费保修服务;台102存储节点联想Lenovo ThinkServer RD440服务器:要求配置2颗Intel Xeon E5-2403v2 CPU(1.8GHz/4-core), 8GB*2 RDIMM DDR3内存 共16GB, 5块2TB 3.5寸7200转SAS热插拔磁盘, SAS RAID卡支持RAID5,集成2个千兆以太网络端口,热插拔1+1冗余电源模块;配置1块Intel TrueScale 40Gb IB QDR InfiniBand HCA卡;原厂商三年免费保修服务;台13交换机及配件加配1台H3C 24端口千兆以太网交换机,配置所需的千兆网线,配置所需的QDR InfiniBand网线,所需的PDU电源插排;套14Intel ICS软件套件Intel Cluster Studio 2013 for Linux软件套件,提供Intel C/C++, Fortran Compiler编译器,Intel Math Kernel Library数学库,包含BLAS、LAPACK、Scalapack等等,OpenMPI、MPICH2和MVAPICH等并行编译环境。套15集群部署管理节点、存储节点配置网络文件共享服务、用户集中管理服务、MPI并行环境及数学函数库,计算节点全部通过网络从主节点下载文件并自动完成所有的安装与设置;计算节点故障管理,在硬件修复完成后,此计算节点只需接入集群网络即会自动完成文件的下载与安装,无需人为干预;集群规模扩展,所需加入的计算节点只要接入集群网络时打开PXE请求即可完成相关的安装工作;软件升级或功能扩展完全可以通过主节点集中完成; 套16集群管理集群用户账号集中管理和维护,在管理节点统一添加用户账号、删除用户账号,统一修改用户账号密码;针对集群节点信息进行统一管理和维护,统一管理和配置集群共享的NFS网络文件系统;统一管理和维护集群用户使用作业调度系统的权限;根据用户需求,定制数据备份功能,将用户数据定时备份到另外的服务器存储空间;套17作业调度集群提供统一的用户使用接口,用户可以一次提交多个计算作业请求,系统软件进行计算资源的自动匹配和调度;作业调度具备良好的拓展性,可支持几百个计算节点规模;支持多队列配置,一个队列可以与一台主机或者多台主机相关联;支持多种调度策略,支持优先处理紧急程度较高的作业,管理员可以手动介入修改自动策略的执行;支持批量作业提交,根据用户提供的数据目录名、有规律的输入文件名,支持批量提交此数据目录下的多个计算任务;提供用户作业统计和分析功能,可以根据用户名、时间段查询用户作业信息;通过图形界面、命令行等方式,监视和控制作业;套18集群监控于WEB的监控界面,用于监控集群系统的活动及配置状况,如处理器使用数量、内存及交换分区使用情况、网络负载、节点状态等;通过图形曲线监控每个结点的工作状态,对合理调整、分配系统资源,提高系统整体性能提供参考依据;套19应用程序优化软件ParamonParatune高性能计算应用特征分析及优化软件,支持历史性能数据的精细化分析,提供定量数据的统计功能,包括任意时刻对资源使用的平均值、任意时刻对资源使用的总量;可以智能识别低效进程并报警;套110系统集成服务本地专业工程师在用户指定地点,实施HPC集群升级部署服务,安装、调试集群系统的硬件和系统软件;协助用户安装应用软件,并完成与作业调度系统的定制接口脚本编写;完成高性能计算集群四项基本测试(Linpack整机系统性能

文档评论(0)

tangtianxu1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档