曙光并行计算机项目的技术方案.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
曙光并行计算机项目的技术方案

xxx工业大学深圳研究生院 集群系统 技 术 方 案 曙光信息产业(北京)有限公司 2010年4月 目 录 1. 方案概要 16 1.1. 方案的优势 16 1.2. 系统配置表 18 1.3. 系统效果图 20 2. 面向网格的曙光TC4000集群系统整体解决方案 13 2.1. 系统整体性能 13 2.2. 技术方案介绍 13 2.2.1. 方案的先进性 14 2.2.2. 方案的可扩展性 17 2.2.3. 方案的兼容性 18 2.2.4. 方案的完整性 19 2.3. 节点机子系统介绍 20 2.3.1. 计算节点 20 2.3.2. 管理和维护节点 20 2.4. 强大先进的集群系统管理 21 2.4.1. 曙光SKVM视频切换系统 21 2.4.2. 曙光集群硬件监控系统 23 2.4.3. 曙光电源管理系统 23 2.4.4. 集群管理软件 24 2.4.5. 开发软件系统 28 2.5. 网络子系统 31 2.5.1. 网络子系统的设计理念 31 2.5.2. 计算网 32 2.5.3. 维护管理网络 33 2.6. 存储子系统 33 2.7. 系统功耗和环境要求 33 2.7.1. 系统功耗 33 2.7.2. 系统环境要求 33 2.8. 系统的高稳定性和高可靠性 34 3. 培训 35 3.1. 培训方式、内容、时间、地点及达到水平 36 3.2. 培训课程和培训教材 37 4. 售后服务 38 4.1. 三级服务体系 38 4.2. 服务承诺 39 4.3. 技术服务项目 40 4.4. 服务方式 41 4.5. 响应时间 42 4.6. 保修服务范围 42 4.7. 产品保修服务流程 43 4.8. 曙光技术服务中心 43 4.9. 保修期后的服务 43 5. 项目实施计划 44 5.1. 概述 44 5.2. 项目管理控制 45 5.2.1. 组织管理结构 45 5.2.2. 过程控制 45 5.2.3. 项目文档管理 46 5.3. 项目实施方案 46 5.3.1. 服务器产品的包装和运输 47 5.3.2. 服务器设备到货验收 48 5.3.3. 安装调试验收 48 5.3.4. 设备验收 48 5.3.5. 项目完成总结 49 5.3.6. 交接和维护 49 5.4. 质量保证 49 5.5. 制造标准 50 5.6. 安装与调试 50 5.6.1. 安装与调试方案 50 5.6.2. 安装与调试的目标 51 5.6.3. 硬件安装与调试规范 51 5.6.4. 软件安装与调试规范 54 5.7. 验收 54 5.7.1. 各阶段验收的基本标准 54 5.7.2. 验收所依照的技术标准 55 5.8. 时间进度表 56 6. 附件 57 6.1. 公司介绍 57 6.2. 最新中国TOP100排名 61 6.3. 经典案例 62 6.4. 行业案例 68 方案概要 方案的优势 整体性能 整个系统共采用了11个计算节点,1个管理节点,每个节点采用2颗AMD 2214 Ghz处理器,共24个处理器,整个系统浮点计算峰值达1920亿次/秒。(详见 2.1系统整体性能) 本方案中采用的曙光TC4000超级计算机是一个很成熟的产品,具有极高的系统稳定性和可靠性。经实际运行测算,其平均无故障时间(MTBF)突破了25万小时大关。(详见2.9 系统的高稳定性和高可靠性) 集群技术 采用AMD64位CPU的曙光A620r-F服务器,能支持32和64位的应用系统,提供高性能的处理能力。 计算节点采用曙光天阔A620r-F服务器,具有全球领先的2U的计算密度,同时具有最好的性能价格比。(详见 2.3.1计算节点) 采用计算网、维护管理网双网设计,实现双网分离、专网专用,同时又相互备份,达到系统的高性能和高可靠性。(详见 2.5.1 网络子系统的设计理念) 在计算网络上,采用了符合科学研究类应用特点的千兆以太网网络,可以满足科学研究并行计算对网络的需求。(详见 2.5.2高速计算网) 曙光TC4000独有的、具有自主知识产权的集群管理系统。包括适合大规模集群系统的SKVM网络实现了对1024以上节点统一控制,软硬件一体化的集群监控系统弥补和纯软件或纯硬件监控系统的天生不足,同时提供曙光集群操作系统DCOS和国家智能计算机研究中心大量集群软件为用户提供更为丰富和更多功能的软件产品选择。曙光作业调度系统DPBS支持动态的作业调度和工作负载均衡功能。(详见 2.5强大的集群管理系统) 提供完善的软件系统:PGI 32/64 bit编译器、GNU 32/64 bit编译器、64位操作系统,以及在并行软件开发中常用的数学库和工具软件,如MPI、PVM、OpenMP、LAPACK、ScaLAPACK、FFTW、PE

文档评论(0)

pangzilva + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档