- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
cluster-并行计算PC机群地构建
并行计算PC机群的构建
随着计算机硬件技术的高速发展,处理器和网络的性能不断地迅速提高和价格的日益下降,使得并行计算日益从传统的超级计算平台转移到由一组高性能节点或工作站/PC机构成的称之为机群的计算平台上,从而机群成为构建可扩放并行计算机的一大趋势。机群在计算机界有很多称呼,其中松耦合的工作站/PC机群也被称为工作站机群COW(Cluster of Workstation)或工作站网络NOW(Network of Workstation);而紧耦合的高性能服务器节点机群也被称为构筑高端大规模并行机的机群系统(如SP2和Option Red)。
本文将主要从PC机群软、硬件环境的选择及配置出发给出一个逐步的PC机群构建手册,以使广大的科研工作者能够更为方便的在PC机群环境中开展自己的工作。
并行计算机群是目前由于硬件的时效性很强,所以给出例子的意义并不是很大。我们这里给出一套配置主要是为了以后叙述的方便,读者应该根据当前最新的硬件信息进行选择。
PC机群硬件部件的选择
在PC机群的构建过程中,硬件部件应根据所要部署应用的类型又针对性的加以选择,具体原则请参见《并行算法实践》第2.2节(硬件的选择与安装)。本文沿用该章所给出的示例配置,如下:
该PC机群包括1个服务节点(兼作计算节点)和63个计算节点。
(1)服务节点配置:
CPU:Pentium Ⅳ 2.0G(512KB全速二级缓存)
内存:1G(2?512M)Rambus
硬盘:80GB IDE
主板:ASUS P4T Socket 423
网卡:3com 905 –TX(两个)
显卡、显示器、键盘、鼠标、光驱、软驱:略
(2)计算节点配置:
CPU:Pentium Ⅳ 1.5G(512KB全速二级缓存)
内存:512MB(2?256M) Rambus
硬盘:40GB IDE
主板:ASUS P4T Socket 423
网卡:3com 905 –TX
另外,交换设备由2个3com 3c16980和1个3com 3c16985的交换机通过一个matrix module堆叠而成,并安装了一个千兆光纤模块,以备服务接点连接内部机群的网卡升级为千兆网卡。
据此配置清单,从市场上采购硬件并连接成功后便可以开始机群软件环境的配置。
PC机群软件环境的配置
如《并行算法实践》第2.2节(软件的选择与安装)本节将主要讲述如何在Linux环境下构建并行计算PC机群的软件环境。
OS的选择与安装
Linux是目前构建高性能计算机群的一个最佳的选择。在众多的Linux发行版本中,还要考虑的是系统管理工具的友好性,这一点Redhat与Suse的工作是成功的;同时系统功能的可裁剪性也是很重要的,如Debian系统在这一点上做的就非常出色。
在此笔者建议对Linux系统有比较深入认识的读者可选用Debian作为系统平台,因为Debian能够根据用户的需要最精确的选择安装、更新相应的软件包,避免过多的冗余服务占用系统资源,最大限度的满足用户对性能的要求;若是Linux系统的入门者则选用Redhat或Suse较为合适,因为这些发行版本提供了较为友好的用户安装、使用界面,并且配备了图形化的系统管理工具,避免了众多的命令行操作。
在所创建的示例机群中使用的是Redhat 9.0版本(内核2.4.28)。介绍Linux系统具体安装的书籍有很多,这里就不再敷述。
安装过程中请选择“定制”,并在“选择软件包组”时在默认的基础上选中【服务器】|【网络服务器】(telnet-server、rsh-server)、【服务器】|【服务器配置工具】(NFS等服务器配置工具)、【开发】|【开发工具】(gcc等基本开发工具)、【系统】|【管理工具】(图形化的系统管理工具)等软件包组。
操作系统安装完毕后,我们假设具有如下信息:
服务节点主机名为“node0”,IP地址为“00”;计算节点相应的主机名为“node[1..63]”,IP地址为“192.168.0.[1..63]”。
单一登录(Single Sign On)的构建
用户可以从机群系统的任何一个节点登录,而且在整个作业执行过程中只需登录一次,不必为将作业指派到机群中的其它节点而重新登录。这里我们采用《并行算法实践》中所介绍的第二种方法“构建用户管理脚本”来维护系统中用户信息的一致性,使用户不再重复输入密码即可登录到机群中的另一个节点上。这包括以下步骤:
以root用户登录到节点node0,修改文件/etc/hosts、/etc/host.equiv,在其中写入机群所有节点的名称和IP。
图 1
图 2
图 3
图 4
修改系统的服务设置,通过服务设置工具启动如下系统服务:nfs、rexec、rsh、rlogin。其中后面三个服务是与Remote Shell
您可能关注的文档
- 9.鲸 玟.doc
- 9-1静电场公开课.ppt
- 9.点火系公开课.ppt
- 9.电脑棋手课件.ppt
- 9.鲸公开课.ppt
- 9.电脑棋手教案.pptx
- 90解表格.ppt
- 920人类迈入电气时代课件.ppt
- 94_人教版小学数学一学年上册全册完整教学.doc
- 9.《鲸》教案.ppt
- 2025年安全教育培训消防安全专项考试模拟试题集.docx
- 2025年安全教育培训职业健康安全知识试题汇编及答案解析实战.docx
- 2025年高压电工考试题库:高压试验技术操作电气设备操作经验分享试题.docx
- 第三单元+传承中华优秀传统文化 七年级道德与法治下册同步高效课堂(统编版2024).pptx
- 2025年高压电工考试题库:高压试验技术操作实操技能训练试题.docx
- 2025年安全教育培训考试应急救援知识题库试题汇编及解析.docx
- 主播运营合同范例.docx
- 2025年安全教育培训职业健康安全知识试题库解析与解题技巧实战技巧实战演练技巧实战.docx
- 机动车质押借款合同.docx
- 2025年安全教育培训职业健康安全知识试题汇编及答案解析实战技巧实战演练攻略.docx
文档评论(0)