计算机容错技术.ppt

计算机容错技术 魏贇 第一章 概述 容错和可靠性 容错技术的发展概况 容错技术的主要内容 容错技术应用 一、容错和可靠性 故障、失效和错误的概念 可靠性的概念 容错的概念 可靠性和容错的关系 (一)故障、失效和错误的概念 失效(failure)是指硬件物理特性异变,或软件不能完成规定功能的能力。 故障(fault)是指硬件或软件的错误状态,是失效在逻辑上的等效。一个故障可以用种类、值、影响范围和发生时间来描述。 错误(error)是指程序或数据结构中的故障表现形式,是故障和失效所造成的后果。 容错设计的软件可以有某些规定数目的故障但不导致失效, 但对无容错的软件而言,故障即失效。 故障的分类 若按逻辑性来分 逻辑故障:造成逻辑值发生变化的故障 非逻辑故障:造成象时钟(clock)或电源出错等错误的故障 按时间划分: 永久性故障:调用诊断程序进行故障定位,然后采取纠错措施 间隔性故障:可以通过更换硬件或软件等途径来达到修复的目的 偶然性故障:只能靠改善环境条件等努力来减少这类故障 错误的根源 (二)可靠性 概念 实现系统可靠性的方法 系统可靠性的指标 1、概念 可靠性的含义 广义:一切旨在避免、减少、处理、度量软件/硬件故障(错误、缺陷、失效)的分析、设计、测试等方法、技术和实践活动。 狭义:指软件/硬件无效运行的定量度量。 可靠度:在规定的运行环境中和规定的时间内软

文档评论(0)

1亿VIP精品文档

相关文档