故障注入测试方法的知识.pdf

故障注入测试 放射研发测试部 2 故障注入的概念 故障注入提出于70 年代初期, 之后一直被工业界用来对容错系 统的设计进行验证。80年代中期, 故障注入技术逐渐开始被高校 和研究部门所采用。进入90 年代后, 该技术越来越引起研究人 员和工程设计者的重视, 对故障注入的研究与应用也随之深入和 广泛。 故障注入的概念: 故障注入是指按照选定的故障模型,用人工的方法有意识地产 生故障并施加于特定的目标系统中, 以加速该系统的错误和失 效的发生, 同时采集系统对所注入故障的反应信息,并对回收 信息进行分析,从而提供有关结果的过程。 3 故障注入的分类 按所注入的故障类型分:软件故障注入、硬件故障注入 按系统故障的抽象级别:可分为晶体管开关级、逻辑门级、芯片管脚级、微指令和 宏指令级、系统级、应用级的故障注入等; 4 底层驱动及相关硬件故障插入测试 寄存器故障插入测试: [概念] 此处寄存器故障是指寄存器值与期望值不符的状态。 [测试目的] 模拟寄存器值被异常修改后系统的运行规律是否符合用户需求。 [故障产生原因] (1)软件发生错误,例如越界 (2 )电源低压波动 (3 )芯片内部故障 [故障可能产生的后果] (1)业务局部中断 (2 )业务没有中断但不正确 (3 )扩散为系统级故障 [测试时的故障产生方法] 修改寄存器值。 [测试步骤] (1)增加修改寄存器值的命令 (2 )运行程序,在程序正常运行时通过命令修改寄存器值 (3 )观察系统运行情况 (4 )重复步骤2和3,对主要寄存器进行故障插入测试 [测试的期望结果] 系统能够检测到芯片寄存器或相关业务异常,并能正确倒换到备用单板或对芯片进行重新初始化,重新初始化后 业务正常。 5 底层驱动及相关硬件故障插入测试 误码测试 [概念] 所谓误码就是当发送端发送“1”码元时,在接收端收到的却是“0”码元,反之亦然。这种收发信码的不一致 就称为误码。 [测试目的] 测试芯片及其驱动程序在发生误码情况下是否具有容错能力。 [故障产生原因] (1)收发芯片异常 (2 )线路干扰 (3 )时钟不稳定 [故障可能产生的后果] (1)误码率太高,使业务局部中断 (2 )业务没有中断但误码过多 (3 )扩散为系统级故障 [测试时的故障产生方法] 需要专门的测试仪器(比如传输用的SDH测试仪) [测试步骤] (1)将测试仪器连接到单板 (2 )利用仪表进行各种误码的插入测试(分为短时误码插入与长时间误码插入:长时间最好能达到24小时), 观察此过程中产生的现象是否和设计目的有冲突,例如如果设计为线路有误码时进行断链、倒换,则检查是否能 倒换,如果设计为有误码时链路要保持连接,则检查此时链路是否能保持连接。 (3 )停止误码插入,检查是否能恢复到误码前的状态。 [测试的期望结果] 线路出现误码,单板能够正确上报,告警抑制关系正确,停止误码插入后,单板能够恢复正常,停止上报误码。 6 底层驱动及相关硬件故障插入测试 晶振失效测试 [概念] 晶振失效包括晶振短路、开路、频率漂移,晶振失效测试是指通过模拟晶振失效来观察系统在晶振发生失效情况 下的软件运行情况是否符合需求的测试。 [测试目的] 测试晶振失效后系统的运行规律是否符合用户需求。 [故障产生原因] 晶振老化失效。 [故障可能产生的后果] (1)业务中断 (2 )误码 (3 )扩散为系统级故障 [测试时的故障产生方法] 用镊子轻触晶振的两个引脚,使晶振输出短路到地或短路到电源,当然,这种方法产生的信号质量差,如果要得 到好的信号质量,则要开发专门的测试用具了。 [测试步骤] (1)启动程序,使软件正常运行,加入业务数据流, (2 )用镊子轻触晶振的两个引脚,使晶振输出短路到地,检查系统的运行状态,在晶振短路的条件下运行一段 时间后,再检查系统的运行状态, (3 )用镊子轻触晶振的两个引脚,使晶振输出短路到电源,检查系统的运行状态,在晶振短路的条件下运行一 段时间后,再检查系统的运行状态, (4 )如果条件允许,进行晶振开路测试,检查系统的运行状态。 (5 )对其它晶振重复步骤1~4。 [测试的期望结果] 对于重要业务,能立刻倒换到备用设备上去。对于所有业务,在晶振失效状态下,故障不应扩散到其它单板或模

文档评论(0)

1亿VIP精品文档

相关文档