使用 CAT 简化 AI 集群的部署和管理.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
使用 xCAT 简化 AIX 集群的部署和管理 基于 IBM? Power 520 Express? (8203-E4A) 的实践 祁 晓璐, 软件工程师, IBM 2010 年 9 月 01 日 本文主要介绍了 xCAT 软件的工作原理,并且通过在 IBM? Power 520 Express? (8203-E4A) 上的实践, 演示了如何使用 xCAT 来简化 AIX 集群的安装和管理的具体方法和步骤,方便AIX 集群使用者了解 xCAT 相关的问题,以便于更好的管理和维护基于 xCAT 的 AIX 集群。 xCAT 简介 xCAT (Extreme Cloud Administration Toolkit) 是一个开源的可扩展的高级集群管理和配置工具, 允许使用者通过一个单点控制和管理一个集群系统。xCAT 最先是为 IBM xSeries 系列 Linux Cluster 做的第三方软件。它在简化集群管理的同时,还使集群能够方便地实现快速扩展,从而提高了系统管理员的工作效率。 值得一提的是,xCAT 软件包基本上全部由一系列有用的 perl 脚本构成,所以使用者修改代码后不需要重新再编译和安装,而是可以很方便地根据自己的需求直接修改脚本来定制出自己需要 的 xCAT 软件。那么如此实用的工具是怎么工作的呢? 接下来,笔者将用下图来描述 xCAT 的工作流程:xCAT 是基于客户机 / 服务器架构的应用程序,客户端和服务器端的通信主要是由管理节点上运行的 xCAT daemon(xcatd)来控制的, 可以说运行于管理节点上的 xCAT daemon(xcatd)就是整个 xCAT 软件正常工作的心脏。 当管理节点上的 xCAT daemon(xcatd)接收到计算节点发送过来的用 XML 封装的的命令时, 它将通过 ACL(Access Control Lists)来判定发送者是否有权限执行这些命令。此外, xCAT daemon(xcatd)在安装配置计算节点和各个节点重新启动的时候还会收集各个节点发来的状态 和资源信息。 这里我们提到了管理节点和计算节点。xCAT 中对节 点的概念分为以下几类: 这是逻辑上的划分,实际使用的时候可以按照需求将几种逻辑上的节点置于同一个物理节点之中。 计算节点 (Compute node) 管理节点 (Management node) 安装节点 (Install node) 用户节点 (User node) 控制节点 (Control node) 图 1. xCAT 的工作原理结构图存储节点 图 1. xCAT 的工作原理结构图 首先,使用者在客户机上通过 xCAT 命令行输入需要 xCAT 完成的一项任务指令, 该 xCAT 任务指令接着被客户机封装成 XML 发送给服务器端。 服务器端管理节点上运行的 xCAT daemon(xcatd)接收到该任务指令后,先解析出命令名、参数、发起命令的用户名、客户主机 ip 地址以及该命令将影响的节点范围等信息。 接着,服务器端管理节点上的 xCAT daemon(xcatd)通过 ACL 判定出该任务指令发出者是否有权限发起这项 xCAT 任务指令,如果 ACL 判决出该用户有权限发起该任务指令,则该任务就将被放进运行队列中等待执行。 该任务指令执行后,结果会再被服务器发回给客户机端,并显示在任务指令的发出者的终端屏幕上,从而完成整个任务指令的的执行过程。 管理节点上部署 xCAT 工具环境 回页首 下面笔者通过在 IBM? Power 520 Express? (8203-E4A) 上的实践,演示如何使用 xCAT 来简化 AIX 集群的安装和管理的具体方法和步骤。 这里我们提到了 HMC 这里我们提到了 HMC(Hardware Management Console,硬件管理控制台): IBM HMC(Hardware Management Console,硬件管理控制台)最早是在顶级的 p690 服务器 系统中引入的。 HMC 为用户提供标准的图形化的用户界面,用于对单台或多台 p 系列服务器进行配置管理和分区(PAR)管理。 通过 HMC 系统管理员可以完成以下工作: 创建和维护多分区环境。 可以为每个分区打开一个虚拟的终端窗口。 为每个分区显示操作面板的 LED 值。 诊断、报告和保存硬件环境的改动。 控制被管理的系统加电和关机。 对硬件故障进行诊断,并为更换相关硬件提供途径。 激活处于 On Demand 状态的处理器。 图 2. 集群网络结构图 这里我们提到了 LPAR( 逻辑分区 logic partition): LPAR( 逻辑分区 logic partition) 是基于 IBM Power 系列硬件的逻辑分区

您可能关注的文档

文档评论(0)

hao187 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体武汉豪锦宏商务信息咨询服务有限公司
IP属地上海
统一社会信用代码/组织机构代码
91420100MA4F3KHG8Q

1亿VIP精品文档

相关文档