磁盘故障错误处理.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第PAGE9页, 共 SECTIONPAGES 11页 磁盘错误码介绍 磁盘错误码定义了设备运行过程中磁盘可能发生的错误。 SATA磁盘的常见错误码包括:3/11/0、3/14/1、b/0/0、4/44/0等。其中3/14/1、b/0/0、4/44/0 属于B类错误,先下电30s后上电。 SAS磁盘的常见错误码包括:2/4/0。属于A类错误,永久下电。 下面表1列举错误码的详细说明 分析 处理方式。(分析部分是参考以前的经验文档,只作参考) 表1 错误码分析介绍 Sense key 错误码 详细说明 分析 处理方式 2 Not ready Indicates that the HDD is not accessible. Operator intervention may be required to correct this condition.没有准备好 2/4/0 LOGICAL UNIT NOT READY, CAUSE NOT REPORTABLE 磁盘本身失效,将该故障硬盘与其它好硬盘一起插入磁盘框,会有较大概率导致好硬盘也无法被识别 磁盘坏,不再使用,直接下电 3 Medium error a flaw in the medium or an error in the recorded data. 介质错误 3/11/0 UNRECOVERED READ ERROR 读错误 无法修复的读错误,通常表示磁盘有坏道 通常表示磁盘有坏道,读错误写修复 3/14/1 RECORD NOT FOUND 磁盘故障,有Disk Abnormal现象,说明磁盘PHY Ready不正常。磁盘分析时无法在南桥发现磁盘。磁盘在写操作受到外界干扰也会报3/14/1错误如:环境因素(静电、灰尘、震动、温度)等 下电后上电 4 Hardware error HDD had detected a non-recoverable hardware failure.硬件错误 4/44/0 INTERNAL TARGET FAILURE 磁盘坏 下电后上电 b Aborted command 一般都是链路问题 b/0/0 磁盘重分配扇区满。 下电后上电 驱动处理磁盘错误码流程 从磁盘本身支持的命令集来看,SATA磁盘属于ATA磁盘,因此SAS 控制器会把SATA磁盘返回的ATA错误码转译为SCSI错误码;SAS磁盘属于SCSI磁盘,磁盘错误码可直接返回给SAS 控制器。所有的磁盘返回的错误码都会以SCSI sense code的形式逐级向上层报告。 正常SCSI命令下发流程: 图1 正常SCSI命令下发流程 错误磁盘处理走快速通道 图2 错误磁盘盘驱动处理流程 步骤说明: 1) 对于故障SAS磁盘,磁盘会在SCSI命令的响应位域内填入对应的sense code(例如,2/4/0)然后将命令下发给DEU;对于故障SATA磁盘,磁盘将相应的status和error寄存器相应的值填入Device to Host命令中对应的位域,然后将命令下发给DEU。 2)DEU将命令转发给SAS 控制器; 3)对于来自SAS磁盘的命令响应,SAS 控制器不会对其内部存在sense code做任何处理;对于来自SATA磁盘的命令响应,SAS 控制器会将status和error的值转译成SCSI sense code。 这样,SAS 控制器彻底屏蔽了ATA命令。所有的磁盘返回的错误码都会以SCSI sense code形式逐级向上层报告。 4)DISK已经知道了某块磁盘报告了某种SCSI sense code,即错误码。根据对报告了特定错误码的磁盘下电处理。 5)磁盘在SCSI中间层中的状态从RUNNING转为OFFLINE,所以RAID将不再能够访问这块磁盘。 不同错误码软件处理流程 A类错误 永久下电 主要错误码:2/4/0属于SAS盘的错误码 A类错误处理主要采用永久下电处理方式。流程如图3所示:(这里只列出图2中最后一步disk到lun) 图3 A类错误码处理流程 B类错误 上下电 主要有3/14/1,4/44/0,b/0/0属于SATA盘的错误码 B类错误处理主要采用下电再上电的处理方式恢复磁盘状态,提高磁盘的容错能力。当发到磁盘的读写命令发生B类错误后,DISK主动将磁盘下电,30后再将磁盘上电,从而复位磁盘的状态,磁盘主动下电期间,LUN对外状态保持不变。 流程如图4所示:(这里只列出图2中最后一步disk到lun) 图4 B类错误码处理流程 流程说明: LUN中1块磁盘发生B类错误,若不是重复的LBA地址发生同

文档评论(0)

添香小铺 + 关注
实名认证
服务提供商

专注于产业研究、商业计划、房地产营销策划、企业运营及咨询管理方案撰写,欢迎咨询。

1亿VIP精品文档

相关文档