计算机可靠性设计-read.ppt

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机可靠性设计-read

第六章 计算机可靠性设计 计算机可靠性设计 计算机故障 计算机可靠性 计算机容错与冗余技术 计算机故障 计算机故障,是指造成计算机功能错误的硬件物理损坏或程序的错误。 故障可分为两大类: 一类是元器件、电路、机械、介质等部分的物理损坏,称为硬故障; 另一类是因电磁干扰、偶尔落入的尘埃、温度变化、电源掉电或病毒感染而导致系统功能不正常,不能正常运行的故障称为软故障。 计算机故障 计算机故障可以分为以下类别: 按照故障部位可以分为独立故障,局部性故障,全局性故障。 按照故障发生时间可以分为暂时、永久性,边缘性故障。 按照故障原因可以分为硬件故障,机械故障,人为故障,软件故障,病毒故障。 计算机故障 故障产生的原因: 集成电路本身缺陷 静电感应击穿 电气干扰 环境影响 管理不善 计算机故障 故障检测原则: 先软件后硬件,先外设后主机,先电源后负载,先一般设备后特殊设备,先公用后专用,先简单后复杂。 故障检测方法主要有: 原理分析法、诊断程序法、直接观察。 插拔或更换器件、静态芯片测量、动态分析、升温降温法。 对时隐时现的故障往往用拉偏的方法可以使故障现象再现,从而便于查找。 计算机可靠性设计 计算机故障 计算机可靠性 计算机容错与冗余技术 计算机可靠性RAS是可靠性,可维护性,可用性的综合。 可靠性是计算机在规定时间与条件下完成规定功能的概率。其中规定条件:环境条件,作用条件,维护条件,操作条件。 可维护性是因为故障而失效时,通过维护恢复正常的能力。 可用性是计算机各种功能满足需要的程度,是计算机在执行任务中任何时刻都能够正常工作的概率。 计算机可靠性 计算机可靠性主要有两个方面:避错和容错。 避错就是故障检测、故障诊断技术则是通过检测和排除系统元器件或线路故障,或纠正程序的错误来保证和提高系统可靠性的方法。 所谓“容错技术”,是指用增加冗余资源的方法来掩盖故障造成的影响,使系统在元器件或线路有故障或软件有差错时,仍能正确地执行预定算法的功能。 计算机可靠性设计 计算机故障 计算机可靠性 计算机容错与冗余技术 计算机容错与冗余技术 计算机修理可以分为热修理与冷修理,其区别就在于修理过程是否计算机加电运行。 为了防止数据丢失,允许进行数据备份,也可以分为热备份与冷备份。 计算机容错与冗余技术 冗余技术是采用多个设备同时工作,当其中一个设备失效时,其它设备能够接替失效设备继续工作的体系。 在PC服务器上,通常在磁盘子系统、电源子系统采用冗余技术。 冗余可以分为多个层次。 用户容错是用户自行备份数据。 线路容错是对通讯线路与网络进行冗余备份。 存储容错是对存储器进行容错。 计算机容错与冗余技术 在存储器容错中使用最多的技术就是冗余磁盘阵列技术。 冗余磁盘阵列RAID技术1987年由加州大学伯克利分校提出。 所谓RAID(Redundant Array of Inexpensive Disks),是指将多个磁盘连成一个阵列,然后以某种方式写磁盘,这种方式可以在一个或多个磁盘失效的情况下防止数据丢失。 计算机容错与冗余技术 磁盘控制器是一个在主机和磁盘组之间提供接口的电子器件。 从主机的角度看,控制器使得整个磁盘组就象一片又快、又大、又可靠的虚拟磁盘。 RAID的另一特征是具备数据校验(Parity)功能。 校验可被描述为用于RAID级别2以上的额外的信息,当磁盘失效的情况发生时,校验功能结合完好磁盘中的数据,可以重建失效磁盘上的数据。 数据可用性(Data Availability)也是RAID系统的指标之一。 数据可用性指的是阵列内部容错能力的水平,数据可用性程度越高,可被理解为当发生越多的部件失效时而数据访问仍不丢失。 RAID通过基带条、奇偶校验和镜像实现其冗余和容错的目标。 基带条意味着在文件可同时被写入多个磁盘的数据块中。 通过在传输后对所有数据进行冗余检测,奇偶校验能够确保数据的有效性。通过奇偶校验,当RAID系统的一个磁盘发生故障时,其它磁盘能够重建该故障磁盘。 镜像包括创建磁盘的复制拷贝。 磁盘阵列其实也分为软阵列(Software Raid)和硬阵列(Hardware Raid)两种。 软阵列即通过软件程序并由计算机的CPU提供运行能力所成。 硬阵列是由独立操作的硬件提供整个磁盘阵列的控制和计算功能。不依靠系统的CPU资源。 软阵列只适用于Raid0和Raid1。 RAID可以分为0-6等级。 RAID0是数据基带条阵列 RAID1称为镜像的磁盘阵列 RAID2使用并行阵列与汉明码 RAID3是带有奇偶校验的并行阵列 RAID4是带有专用奇偶校验驱动器的独立式传动装置 RAID5是独立式传动装置,所有驱动器均包括奇偶校验 RAID6是拥有两个校验块。 * * *

您可能关注的文档

文档评论(0)

wangyueyue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档