高性能计算集群和络存储相关内容提交文档.docVIP

高性能计算集群和络存储相关内容提交文档.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章、高性能集群计算主要支持厂商和成功案例 IBM Linux集群系统是利用先进的网络设备将基于IA(Intel Architecture)架构的IBM的xSeries服务器连接起来,通过集群技术实现高性能运算。 IBM的大规模并行处理机SP系统及Power服务器系统已广泛地运用在各个领域,SP(深蓝)曾在1997年中的人机大战中因战胜棋王卡斯帕罗夫而享誉全球。作为后起之秀的Linux 集群系统,吸取了SP大规模并行机的诸多优势,并且将SP上的优秀的系统管理软件和并行处理方面的程序移植到Linux 集群系统上,如并行系统管理软件PSSP和通用并行文件系统GPFS等,从而使Linux 集群系统不仅能在并行运算方面的性能得到保障,增强了集群系统的可管理性,而且采用具有高可用性的IBM xSeries服务器,可以大大降低成本。 IBM的Linux 集群解决方案越来越受到众多的研究机构和商家的关注,我们的用户包括:墨西哥大学用256个IBM PC 服务器作为节点从事科学研究;荷兰皇家壳牌公司(Royal Dutch Shell)采用了1024个节点的Linux集群进行地震资料处理和其它的一些地球物理方面的应用;美国Maui高性能计算中心(MHPCC)采用256台IBM x335(共512颗CPU)作为计算节点;西方地球物理公司(WesternGeco)目前已采用了上千个IBM xSeries计算节点的Linux集群系统并与SP系统配合,进行地震资料处理;美国 National Science Foundation计划建立一个大规模的运算网格(Computing Grid),该系统名为Distributed Terascale Facility(DTF),供四家美国科研中心采用,包括建立分子模型供疾病检测、治疗及药物开发,能源来源研究、气候及大气模拟等等,DTF最终可实现每秒进行13.6兆次运算(13.6Tflops),该系统是由IBM负责来建立,共有3300个处理器形成Linux集群系统。 IBM先进技术具体表现: IBM高级电缆连接技术 IBM Advanced Connectivity Technology 创造了机柜环境的线缆连接和管理的新方法,使键盘、鼠标和显示器能串接在一起的线缆连接方式。 服务处理器(Service Processor) IBM Service Process是在主板上的专用服务处理芯片,起到保护的作用,系统管理员能够根据其提供的信息,快速做出反应,帮助及时发现和解决问题。 光通路诊断(Light Path Diagnostic) “光通路诊断”是一套完全基于主板光纤传输的诊断系统,可以精确地定位系统硬件中的隐形故障,帮助系统管理员进行故障定位。 Chipkill内存技术 Chipkill内存业界公认的具有最高容错能力的内存系统,达到4位校验4位纠错,大大提高了可靠性。 集群系统管理软件xCAT IBM上的xSeries服务器上的Linux集群软件可提供的功能包括:系统并行安装和配置;通过命令实现对节点的远程开机、关机和重新启动等操作;监视和控制硬件状态,尤其是提供故障分析能力;支持远程运行远程命令(ssh);支持账号的统一管理;管理节点和节点组的信息等等。 通用并行文件系统GPFS GPFS是从IBM大规模并行机SP上继承下来的,用于提高文件访问效率,提高I/O访问性能,同时提高可用的文件系统,保障数据的安全可靠。 最后在服务器选择上IBM选择刀片服务器作为集群系统计算节点。主要表现在:连接简单,维护容易,扩充方便,节省空间,冗余设计,故障点少,更稳定可靠,减少外部网络端口,降低成本,功耗小,电费少,维护成本低,代表了先进的技术和未来的发展方向。 一个成功实例:中国新疆油田公司研究院地球物理研究所2003年引入了IBM刀片式服务器作为计算节点,共226个节点,每个节点上都有两个CPU,共500多个CPU;1U高的x335作为存储节点,2U高的x345作为管理节点。该平台主要用于石油勘探地震资料处理的高性能计算。 Platform LSF Platform LSF系列产品提供了业界功能最强大的、最全面的网格驱动方案。该系列产品帮助用户管理和优化昂贵而复杂的IT环境,提高IT效率,缩短商业运作周期,大幅度缩减计算成本,并且能够确保服务的顺利实施。 Platform LSF系列产品能够提供卓越的优化网格驱动方案,解决与计算相关的技术问题——比如说包括半导体设计在内的电子工业、航空和国防承包商的管理和研究、汽车制造工业、以及包括生物技术公司在内的生命科学组织。 不管操作系统如何,Platform LSF都可以帮助用户充分利用所有IT资源,其中包括台式机、服务器和主机。这样一来,就可以保证由政策驱动的、优先级的服

文档评论(0)

jyf123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6153235235000003

1亿VIP精品文档

相关文档