并行计算PC机群的构建 .doc

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
并行计算PC机群的构建

并行计算PC机群的构建 随着计算机硬件技术的高速发展,处理器和网络的性能不断地迅速提高和价格的日益下降,使得并行计算日益从传统的超级计算平台转移到由一组高性能节点或工作站/PC机构成的称之为机群的计算平台上,从而机群成为构建可扩放并行计算机的一大趋势。机群在计算机界有很多称呼,其中松耦合的工作站/PC机群也被称为工作站机群COW(Cluster of Workstation)或工作站网络NOW(Network of Workstation);而紧耦合的高性能服务器节点机群也被称为构筑高端大规模并行机的机群系统(如SP2和Option Red)。 本文将主要从PC机群软、硬件环境的选择及配置出发给出一个逐步的PC机群构建手册,以使广大的科研工作者能够更为方便的在PC机群环境中开展自己的工作。 并行计算机群是目前由于硬件的时效性很强,所以给出例子的意义并不是很大。我们这里给出一套配置主要是为了以后叙述的方便,读者应该根据当前最新的硬件信息进行选择。 PC机群硬件部件的选择 在PC机群的构建过程中,硬件部件应根据所要部署应用的类型又针对性的加以选择,具体原则请参见《并行算法实践》第2.2节(硬件的选择与安装)。本文沿用该章所给出的示例配置,如下: 该PC机群包括1个服务节点(兼作计算节点)和63个计算节点。 (1)服务节点配置: CPU:Pentium Ⅳ 2.0G(512KB全速二级缓存) 内存:1G(2(512M)Rambus 硬盘:80GB IDE 主板:ASUS P4T Socket 423 网卡:3com 905 –TX(两个) 显卡、显示器、键盘、鼠标、光驱、软驱:略 (2)计算节点配置: CPU:Pentium Ⅳ 1.5G(512KB全速二级缓存) 内存:512MB(2(256M) Rambus 硬盘:40GB IDE 主板:ASUS P4T Socket 423 网卡:3com 905 –TX 另外,交换设备由2个3com 3c16980和1个3com 3c16985的交换机通过一个matrix module堆叠而成,并安装了一个千兆光纤模块,以备服务接点连接内部机群的网卡升级为千兆网卡。 据此配置清单,从市场上采购硬件并连接成功后便可以开始机群软件环境的配置。 PC机群软件环境的配置 如《并行算法实践》第2.2节(软件的选择与安装)本节将主要讲述如何在Linux环境下构建并行计算PC机群的软件环境。 OS的选择与安装 Linux是目前构建高性能计算机群的一个最佳的选择。在众多的Linux发行版本中,还要考虑的是系统管理工具的友好性,这一点Redhat与Suse的工作是成功的;同时系统功能的可裁剪性也是很重要的,如Debian系统在这一点上做的就非常出色。 在此笔者建议对Linux系统有比较深入认识的读者可选用Debian作为系统平台,因为Debian能够根据用户的需要最精确的选择安装、更新相应的软件包,避免过多的冗余服务占用系统资源,最大限度的满足用户对性能的要求;若是Linux系统的入门者则选用Redhat或Suse较为合适,因为这些发行版本提供了较为友好的用户安装、使用界面,并且配备了图形化的系统管理工具,避免了众多的命令行操作。 在所创建的示例机群中使用的是Redhat 9.0版本(内核2.4.28)。介绍Linux系统具体安装的书籍有很多,这里就不再敷述。 安装过程中请选择“定制”,并在“选择软件包组”时在默认的基础上选中【服务器】|【网络服务器】(telnet-server、rsh-server)、【服务器】|【服务器配置工具】(NFS等服务器配置工具)、【开发】|【开发工具】(gcc等基本开发工具)、【系统】|【管理工具】(图形化的系统管理工具)等软件包组。 操作系统安装完毕后,我们假设具有如下信息: 服务节点主机名为“node0”,IP地址为“00”;计算节点相应的主机名为“node[1..63]”,IP地址为“192.168.0.[1..63]”。 单一登录(Single Sign On)的构建 用户可以从机群系统的任何一个节点登录,而且在整个作业执行过程中只需登录一次,不必为将作业指派到机群中的其它节点而重新登录。这里我们采用《并行算法实践》中所介绍的第二种方法“构建用户管理脚本”来维护系统中用户信息的一致性,使用户不再重复输入密码即可登录到机群中的另一个节点上。这包括以下步骤: 以root用户登录到节点node0,修改文件/etc/hosts、/etc/host.equiv,在其中写入机群所有节点的名称和IP。 图 1 图 2 图 3 图 4 修改系统的服务设置,通过服务设置工具启动如下系统服务:nfs、rexec、rsh、rlogin。其中后面三个服务是

文档评论(0)

kabudou + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档