容错计算第2章.pptVIP

  • 4
  • 0
  • 约3.32千字
  • 约 59页
  • 2019-11-11 发布于湖北
  • 举报
系统可靠性基本概念 北京邮电大学 计算机科学与技术学院 姚文斌 结构 故障的表现及分布 计算机系统可靠性概念 计算机系统可靠性分析 基本概念 失效failure 失效是指硬件物理特性的异变 故障fault 故障是硬件或软件的错误状态,是失效在逻辑上的等效 错误error 错误是指程序或数据结构中的故障表现形式,是故障和失效造成的后果 故障来源 元器件失效 环境因素 温度、湿度、冲击、振动、电磁场、核辐射、盐雾、霉菌等都会对系统可靠性产生影响 为减少环境因素产生的故障,要对元器件进行环境应力筛选,即进行温度循环、热冲击、机械冲击和离心加速度实验,淘汰失效或恶化器件,同时进行环境防护设计,如热设计、机械应力防护设计、化学防护设计、电磁兼容性设计等 设计故障 硬件、软件设计故障 尤其是随着软件规模的扩大,设计故障发生的概率显著上升 故障表现 故障的表现千差万别,可以利用故障模型对故障表现进行抽象 故障模型的优劣 广泛性,即故障模型概括了多少故障 易处理性,即在这种故障模型下,易于进行故障处理(检测、诊断或容忍等)的程度 广泛的模型往往复杂、难于处理,而简单、易于处理的模型又往往不能广泛地反映实际的故障表现 逻辑级的故障模型 固定型故障 电路中元器件的输入或输出等线的逻辑值固定为0或为1。如线接地、电源短路或元件失效等。 短路或开路故障 元件短路是指元件的输出线逻辑值恒等于输入线的逻辑值;

文档评论(0)

1亿VIP精品文档

相关文档