- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
APG40常见问题分析处理
APG40常见问题分析处理
概述
最近全省的APG40都已经打完AGM018的补丁,相比以前APG40稳定性了很多,但是也有着一些相对共性的故障。应山东移动省公司要求,从操作维护的角度分析一下这一些故障问题,总结一下解决的方法。以提高大家APG40的操作维护水平。
这一段时间以来APG40最为常出的故障主要有两种,Raid硬盘的故障和Active Directory(活动目录)同步异常。下面分别对这两个问题就故障现象和处理过程中所需要注意的问题进行一些分析。
Raid硬盘故障
Raid是标准化的工业标准,并不是爱立信开发的标准。APG40在硬件上分为C2和C4两种,这两种硬件的Raid机制不同,所以在故障分析和处理上也完全不同。下面就这两种硬件分别来进行一下分析。
APG40C/2
APG40C/2一共有6块硬盘,每一边各有三块,每边一块组成一对作为一加一的冗余备份。主用边来同时控制两边的硬盘,读写都是同步进行。APG40C/2的node是DPT manager来控制raid硬盘的,查看的以及操作的命令都是以raidutil开头。下面就分别的讲述和分析一下这些命令。
raidutil –K
该命令是用来查看raid的firmware版本以及是否支持cluster 。
在AGM018版本以后firmware的版本都应该是FT0A的,而且Cluster Support都应该是Enabled的。
raidutil –L physical
该命令是用来查看raid物理盘状态,查看的命令以主用边为准。
Raidutil –L physical能看到物理上的6块硬盘,每一边各三块。正常工作的情况下状态都应该是Optimal的,硬盘出现故障的时候状态可能变成failed、missing或着不够6块硬盘,刚刚更换完硬件进行重建raid的时候状态为Replaced Drive。
命令显示的前三块(也就是d0b0开头的)为所下命令测,后三块(也就是d0b1开头的)为另一边。注意这里是本边node和另一边node,不是A边或B边也不是主用边或备用边。因此在更换node或者单边断电之类的操作一定要保证本边(也就是d0b0开头的)的三块硬盘状态为Optimal的。
raidutil –L logical
该命令是用来查看raid逻辑盘状态,查看的命令以主用边为准。
Raidutil –L logical能看到逻辑上的3块硬盘,正常情况下,状态也都应该是Optimal的,如果逻辑上的状态显示为Degraded,这说明某一边的硬盘出现问题,这时候不影响整个APG40的正常工作;如果逻辑上的状态显示为Failed,说明两边的硬盘都出现了问题,这时候肯定会影响到APG40的正常工作,会有部分的cluster 进程或者整个cluster server无法正常启动。另外更换完硬件之后重建过程中也可以用raidutil –L logical来查看,可以看到逻辑硬盘的状态为Reconstruct,后面紧跟着重建完成的百分比。
raidutil -a rebuild dxbxtxdx
该命令是用来进行raid的手动重建,该命令也应该在主用边来做。
该命令针对的是逻辑盘的,后面dxbxtxdx是逻辑盘的盘符,只有逻辑盘的状态为Degraded的时候才能执行该条指令。该指令只是在物理硬盘并没有真正损坏的时候才起作用,如果在raidutil –L physical查看到有硬盘是missing状态或者直接就看不到6块物理硬盘,那么这条命令是不起作用的。
raidutil –f optimal dxbxtxdx
这条命令是用来对某块特定的硬盘强制设成optimal的。
这条命令使用有一些的限制。首先只有是硬盘物理上没有问题,分区信息没有丢的情况下对硬盘强制optimal;其次这条命令只能在本地执行,不能远程用winfiol之类的工具来做,因为做完之后会弹出一个对话框让确认,只有在本地才能点这个对话框。
APG40C/4
跟APG40C/2硬件一样APG40C/4硬件也是一共有6块硬盘,每一边各有三块,每边一块组成一对作为一加一的冗余备份。主用边来同时控制两边的硬盘,读写都是同步进行。不一样的是APG40C/4的Raid硬盘改用LSI MegaRaid来控制,查看的以及操作的命令大都是以megarc开头。下面就分别的讲述和分析一下这些命令。
megarc -dispcfg -a0
该命令是用来查看Raid的状态,包含了物理和逻辑。
主要应该注意log中用红色标出的部分,可以看到逻辑上的状态为Optimal,物理上的状态为online。
Chnl(Channel)的0和1分别表示A边和B边,0永远表示A边,1永远表示B边,这跟C2硬件是完全不同的。
Target的00表示的是逻辑上
文档评论(0)