HP-UX Serviceguard 基本除错工具及方法.docxVIP

  • 63
  • 0
  • 约3.1千字
  • 约 9页
  • 2017-06-07 发布于湖北
  • 举报
HP-UX Serviceguard 基本除錯工具和方法 HP 諮詢中心技術經理 孫瑞貞 文Serviceguard 基本上可以偵測三類問題: Node 發生問題 以下是幾種 Serviceguard 可以偵測到的 Node 問題 : 系統當機自動重起 部份硬體故障 系統鎖住無法運作 網路發生問題 以下是幾種 Serviceguard 可以偵測到的 網路問題 : INTERFACE 介面卡?壞 網路線斷線 ,或無法提供功能 服務發生問題 : 是指特定的 Process 不正常結束 一般而言 , Process 可以被重新啟動。磁碟故障可以經由底層的 Volume managers 偵測到,或由磁碟陣列偵測到,而發出警訊。 erviceguard 本身所啟動的 daemon process 是以 cm 為開頭的名字。以下是幾種 Serviceguard 的 daemon ,提供您參考:?? Cluster daemon: cmcld ?? Service Assistant Daemon: cmsrvassistd ?? Syslog Log Daemon: cmlogd ?? Cluster Logical Volume Manager Daemon: cmlvmd ?? Configuration Daemon: cmclconfd ?? Cluster SNMP Agent Daemon: cmsnmpd ?? Advanced Tape Services Daemon: cmtaped ?? Cluster Network Assist Daemon: cmnetassistd ?? Cluster File Assist Daemon: cmfileassistd ?? Cluster Object Manager Daemon: cmomd ?接下來介紹幾種 HP 有支援的 Serviceguard 除錯工具,提供您參考: cmscancl :可以收集 Serviceguard 的相關設定,首先得把 .rhost 設定所有的 Nodes 名字才可以執行。最常來檢視 cmclconfig binary 檔是否與實際網路環境相符合。輸出結果如下: cmviewconf :可以檢查本機端的 cmclconfd daemon 是否可以連得上並顯示 cmclconfig binary 的內容。輸出結果如下: cmviewcl -f :可以顯示和檢查 Serviceguard 的設定和相關參數內容,還有 Cluster reformation 的時間和版本。輸出結果如下: HELM :可以從 去 下載。此工具可顯示 Cluster 內的所有 Nodes 之間的 Heartbeat 回應時間 (latency) ,用來評估 Node Timeout 時間值的最佳設定。減少因緩慢的 Heartbeat 回應而導致不必要的 switch 。 使用方法如下: 除此之外還有 HP 未正式支援的 Serviceguard 除錯工具,提供您參考: xscancl :可以在 RedHat Linux 和 Suse Linux 的作業系統上收集 SG/LX 的 Cluster 環境設定資訊。 counters :可以用來觀查 Serviceguard 的相關網路卡上 unicast 封包的流量情形。看是否有正常地增加流量數。 dlpiping :從 link level 去檢查連線狀態並顯示 Mac address 的值。 makebrcstsg : Serviceguard 的指令像 cmquerycl 和 cmgetconf 和 cmcheckconf 和 cmapplyconf 是經由送 UDP broadcast 來處理的。 makebrcstsg 可以送 UDP broadcasts ,它 相似 Serviceguard 的 Socket option 。 timer9 : 可以用來偵測系統是否鎖住( hang ),使用容易對系統的負擔也輕。 cmpdisks :是一個 shell script ,可以用來比較 nodes 之間的 shared disks 。 例如當 cmquerycl 或 cmcheckconf 或 cmapplyconf 指令顯示出問題是來自於 LVM 時,可以用此工具來作 Nodes 之間的 LVM 磁碟比較性。 dumplvmtab :用來檢視 /etc/lvmtab 檔,可以顯示出 VGID 。 lvm11 :可以用來讀取出 LVM 磁碟的表頭內容。 cminitlock :用來檢查 Cluster lock 磁碟是否正常,是否有作過 initialize ? lsof :這是一個 public domai

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档