hacmp工作原理及管理.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HACMP的常用命令: 1、查看Cluster的运行情况: # /usr/sbin/cluster/clinfo –a # /usr/sbin/cluster/clstat /usr/sbin/cluster/clstat可以帮助你查看当前HACMP的节点状态。 屏幕会如下显示: clstat - HACMP for AIX Cluster Status Monitor ---------------------------------------------------------------- Cluster: cluster1 (1) Tue Jul 20 09:52:03 CDT 1999 State: UP Nodes: 2 SubState: STABLE Node: j50a State: UP --节点A状态 Interface: j50_a_srv (0) Address: 192.9.200.1 -- 服务IP地址 State: UP --服务IP状态 Interface: j50_a_tty1 (1) Address: 0.0.0.0 State: UP --心跳线状态 Node: j50b State: UP --节点B状态 Interface: j50_b_srv (0) Address: 192.9.200.2 -- 服务IP地址 State: UP --服务IP状态 Interface: j50_b_tty1 (1) Address: 0.0.0.0 State: UP --心跳线状态 ************************ f/forward, b/back, r/refresh, q/quit ***************** 启动HACMP: # smitty clstart 注:有两种启动HACMP的方式: now:手工启动HACMP restart、both:在系统启动时自动启动HACMP 3、停止HACMP: # smitty clstop 注:有三种停止方式: graceful:只停止本节点上HACMP的运行,并释放由本节点管理的资源,但 允许其它节点接管。 graceful with takeover:停止本节点上HACMP的运行,释放资源,让其他节 点接管。 forced:停止本节点上HACMP的运行,但不释放资源。 查看Cluster的进程状态: # ps –ef | grep cluster 注:应有三个HACMP进程:clstrmgr、clinfo、clsnuxpd 5、查看Cluster的日志及错误信息: # more /tmp/hacmp.out # more /var/adm/cluster.log 注:可以在启动HACMP时使用 # tail –f /tmp/hacmp.out命令,以查看HACMP的 启动是否正常或跟踪启动时的错误信息。 查看Cluster运行的历史记录: # cd /usr/sbin/cluster/history 注:此目录下存放着每天的Cluster运行记录 7、查看Cluster运行时的网络情况及资源组的使用情况: HACMP启动之前: # netstat –i 此时应可以看到boot和standby地址 # lsvg –o 此时只能看到本地的VG HACMP启动之后: # netstat –i 此时应可以看到service和standby地址 # lsvg –o 此时应可以看到本地的VG及共享VG HACMP常见故障解决: 1、导致集群中节点失效的无反映开关(Deadman Switch) 问题现象: 集群中的节点经历着极端的性能问题,如:大量的I/O传输、过多的错误记录、内存不足等,导致集群管理器(clstrmgr)没有得到足够的CPU处理时间,而引起无反映开关在分配的时间被重置。某个应用程序运行权限高过集群管理器时,会导致此问题。 解决方法: 术语“Deadman Switch”指的是在特定集群条件下,未能及时重置该开关,引起系统宕机和转储的内核扩展部分。无反映开关在超过了特定的时间限制后会宕掉处于挂起状态的节点。此过程导致集群中的其它节点接管处于挂起状态节点的资源。要解决此问题需要解决与之相关的几个性能问题: 1、调整系统I/O pacing 2、增加信息同步(syncd)的频率 3、增加通信子系统使用的内存量 4、更改错误探测速率 调整系统使用I/O的步调: 使用I/O pacing调整系统,使得在大量写操作时,系统资源的分配更合理。为HACMP集群激活I/O Pacing是必要的,尤其是在集群中可能会有大量磁盘数据块写操作的时侯。 按下述步骤修改I/O Pac

文档评论(0)

yan698698 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档