- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Copyright ? 2010 Huawei Technologies Co., Ltd. All rights reserved. Page * Thank you Copyright ? 2010 Huawei Technologies Co., Ltd. All rights reserved. OceanStor 18000系列存储系统巡检指导及常见问题处理 目标 学完本课程后,您需要掌握: 使用OceanStor Toolkit对高端存储阵列进行巡检; 巡检过程中常见问题的处理操作。 机房环境满足存储设备运行的标准是存储设备长期稳定运行的直接保证,定期检查机房环境可以有效降低存储设备发生故障的概率。 机房环境巡检主要包括一下两方面: 机房是否存在腐蚀情况 机房是否存在过温风险(风险案例:S3900存在过温保护掉电现象) 标准工作温度:海拔低于1800m时,5℃~40℃ 海拔为1800m~3000m时,5℃~30℃ 请使用以下checklist附件进行巡检确认 机房环境巡检 巡检工具使用OceanStor Toolkit OceanStor Toolkit可以对设备进行实时的、全面的检查,对巡检结果中的异常现象会提供对应的修复建议。 以下以企业网ISM ServiceTool V100R001C03SPC700 存储设备巡检-工具 实时巡检 立即执行巡检任务 开局巡检 开局时进行巡检 巡检都可以在配置检查策略的时候,勾选“发送报告指定收件邮箱”,将巡检结果自动发送给所配置的邮箱。 巡检完成后,需要特别关注“不通过”项。 存储设备巡检-方式简介 选择设备 选择巡检项 设置检查策略 执行巡检 存储设备巡检-巡检步骤 选择设备 1、默认会将巡检支持的设备添加到此表格 2、查看当前巡检支持的所有产品及版本号 选择检查项 1、左边为选择的巡检设备,右边为当前选中设备的检查项情况 2、默认所有检查项全选,可根据自己的需要进行勾选 设置检查策略 1、设置巡检报告保存位置,默认已提供,可根据需要进行修改 2、可根据需要设置邮件发送巡检报告 执行巡检 1、右键单击正在检查的设备,可查看当前设备的检查标准页面 2、单击正在检查的检查项,可查看当前检查项的执行情况 3、巡检完成后可查看巡检报告 4、打开结果目录方便查看历史巡检报告 巡检结果界面 存储设备巡检-巡检结果处理 对于巡检结果要特别关注“不通过”项。 巡检不通过时,请选择界面下方的“查看巡检报告”选项,系统自动生成固定格式的巡检报告。 选择报告右侧导航树上以IP命名的节点,查看不通过项的处理方法。 存储设备巡检-巡检结果处理 如果按照巡检报告中所述解决方法仍不能解决问题(标准:再次巡检时仍不通过),在结束巡检后会要求收集信息,请根据界面提示进行信息收集并返回研发工程师进行分析处理。 存储设备巡检-信息收集 FRU器件包括控制器、硬盘、接口卡、BBU等器件 此类硬件均有一定的故障率 一般情况下故障后请遵循以下原则进行处理: 硬盘属于外购件,故障后可直接更换。 若需要分析硬盘故障根因,请收集磁盘的S.M.A.R.T等信息(收集方法请参见《受限命令》参考中的disktool 命令),用以确认硬盘故障的直接原因;根因确认则需要返厂分析,周期较长。 控制器、接口卡、BBU等属于自研器件,巡检发现故障后需要收集相关信息返回研发定位以确认处理步骤。 请使用OceanStor Toolkit“信息收集”工具收集相关信息,或在ISM界面上选择导出各项数据。 常见巡检问题-(1)FRU故障 误码数是设备上记录的各个端口所接收到的误码总和。 产生的原因很多,一般分为部件故障和非部件故障。 部件故障,一般是由于链路上部件异常或链路上各部件间接触异常导致 非部件故障,产生误码的原因一般为线缆触碰、线缆拔插、接口虚插 一般情况请遵循一下原则和方法进行 常见巡检问题-(2)误码 情况 确认方法 处理方法 误码数持续无变化 一般巡检出现误码后,可间隔15到20分钟再巡检一次,比较两次误码数是否有增加。 如果误码未增加,则可能是线缆触碰、线缆拔插等因素导致的。此类因素不用关注,直接通过ISM管理界面或者CLI下执行clearber将误码清除即可。 误码数持续变化 重新拔插线缆,确保接口插紧。若误码不再增加,则可能是接口虚插导致的误码增加。此类也可直接通过ISM管理界面或者CLI下执行clearber清除误码。 若拔插线缆后误码仍旧增加,则可能是链路上某部件异常而信号质量差导致的。此类情况,则需要通过交叉排查的方式确认:将好的部件件逐一替换问题链路上的各部件
您可能关注的文档
- 第四章 常见草坪草种及其.ppt
- 高中化学课件-苏教版-必修2-《从微观结构看物质的多样性-不同类型的晶体》课件六39张.ppt
- 客户产品介绍 -飞利浦监护整体.pptx
- LMC项目背景SEMIA公司简介.ppt
- 化学 第三单元 第20讲 难溶电解质的溶解平衡 配套课件.ppt
- B25-2F 变更和索赔的处理方法与原则.pptx
- 旋磨术常见故障与策略.pptx
- 第5讲6数字量输入输出-DMA控制系统.ppt
- 高中化学课件-苏教版-必修2-《微观结构与物质的多样性》高三课件.ppt
- 自动装置 第五章电力系统自动装置原理.ppt
- 三年级数学填空专项练习题解析.docx
- 建筑土建施工关键流程解析.docx
- 2025重庆綦江区永新镇人民政府招聘公益岗2人备考题库附答案详解(突破训练).docx
- 2025重庆綦江区永新镇人民政府招聘公益岗2人备考题库附答案详解(综合卷).docx
- 幼儿园职工活动会议组织方案.docx
- 城乡供水管网改造工程监理质量验收报告.docx
- 宝钢安全培训课件.ppt
- 2025重庆綦江区永新镇人民政府招聘公益岗2人备考题库附答案详解(巩固).docx
- 2025重庆綦江区永新镇人民政府招聘公益岗2人备考题库附答案详解(模拟题).docx
- 2025重庆綦江区永新镇人民政府招聘公益岗2人备考题库附答案详解(研优卷).docx
原创力文档


文档评论(0)