一种基于极值理论故障分布探究方法.docVIP

  • 6
  • 0
  • 约4.61千字
  • 约 9页
  • 2017-11-13 发布于福建
  • 举报

一种基于极值理论故障分布探究方法.doc

一种基于极值理论故障分布探究方法

一种基于极值理论故障分布探究方法   摘要:应用在金融、电信等关键业务领域中的高端容错计算机具有事务处理能力极强、可用性高、可靠性高等特点。有关此类计算机开展故障分布研究对于故障预测、系统维修,保障系统高可用运行具有重要意义。提出一种基于极值理论的故障分布研究方法,将高端容错计算机故障发生事件作为稀有事件,集中关注数据的尾部特征。与传统方式的故障分布研究方法相比,省去了数据分布形式的先验假设,更适用于小样本的情况。 关键词:故障分布; 高端容错计算机; 极值理论 中图分类号:TP307 文献标识码:A文章编号:2095-2163(2013)06-0018-04 0引言 高端容错计算机作为事务处理能力极强、可用性极高的服务器系统,广泛应用在金融、电信、能源、交通、航空等国家关键业务领域中。这些关键行业对系统的处理能力和容错能力均有严苛的要求,系统一旦失效就可能会造成无法挽回的巨大损失,所以高端容错计算机在投入使用之前必须对其处理能力和可用性进行严格的评测,而针对此类计算机系统开展故障分布研究和故障注入技术研究则可为高端容错计算机评测提供了有效的技术支持和理论支撑,因而具有高度必要性和现实重要性。 在对高端容错计算机故障分布进行研究时,传统的统计分析方法一般要预先假定故障数据服从某一先验分布。而此分布的选取至关重要,需要大量故障数据的统计特性作为基础参数。当故障数据很少时,先验分布的选择就很困难,这时对所有数据进行建模而得到的母体分布一般不能准确反应尾数分布,因此,如果单独对尾部数据进行研究,可能会得到更为准确的分析结果。 分析和研究真实系统的故障特征,对于高可靠/高可用系统的设计和应用具有很强的支持和指导作用,有利于高可靠/高可用系统的管理与维护[1]、故障诊断[2]、故障预测[3]以及故障传播[4]方面的研究。 本文提出一种基于极值理论的故障分布研究方法,将高端容错计算机故障发生事件作为稀有事件,集中关注数据的尾部特征。与传统方式的故障分布研究方法相比,省去了数据分布形式的先验假设,更适用于小样本的情况。 1极值理论 极值理论[5]为准确估计一个分布的尾部概率提供了强大的理论基础,有效地减少了选择的自由度而又不降低准确性。极值统计是以次序统计量为基础,研究由一系列独立观测所得到的最小或最大随机变量分布的理论。极值事件常出现在某种分布的尾数部分,但对所有事件进行拟合时,所得分布函数往往不能很好地反映其尾部事件,这时母体分布尾数部分的分布可用极值分布来精确拟合。对大多数分布来说,当观察值的个数趋于无穷时,极大值或极小值的分布属于3种渐近分布形式之一,即:Gumbel-I型,Gumbel-II型,Gumbel-III型,分别对应3种不同的原始分布,即指数型分布、柯西分布和有界型分布,又可分别称为Gumbel分布、Frechet分布、Weibull分布。 对于上极限分布来说,必收敛于以下3种形式的渐进分布: 对任何分布函数未知的独立随机变量,若该随机变量为极值事件,在确定其属于上极限分布还是下极限分布后,可以利用相应的吸引域的确定方法来得到属于3种极值分布形式中的哪一种,再利用已知数据与之拟合,由此得到极限分布函数。 分布函数的尾部形态决定了其应该归属于哪种渐近形式。如果该分布函数在最小值方向的尾部是指数衰减的,则将属于Gumbel族;如果该分布函数在最小值方向的尾部是多项式衰减的,则其属于Frechet族;如果该分布函数在最小值方向的尾部是有上下限的,具有一个有限的较高值或较低值,那么就属于Weibull族。 如果得到了一个特定数据集的吸引域,就能够推算得到分布函数的渐近分布的参数。但是用于分析的样本数据规模往往有限,尤其是分布函数未知的情况下,就需要使用特定方法来确定数据集的吸引域。本文使用尾部曲率法,通过计算尾部曲率来判断吸引域,采用相邻区域中平均斜率的比值来计算尾部曲率,可减小方差。 在概率纸上利用最小二乘方法拟合直线,得到两个相邻区域的平均斜率,之后利用两个斜率的商来描述尾部曲率,计算公式为: Q=Qn1,n2Qn3,n4(1) 式中,Qi,j表示第k个统计量(i≤k≤j)在Gumbel概率纸上利用最小二乘法拟合出的直线斜率的逆,可表示为 Qni,nj=mΦ11-Φ10Φ01mΦ20-Φ210(2) 其中,m=nj-ni+1, Φ01=∑njk=nixk,Φ10=∑njk=ni-ln-lnk-0.5n,Φ20=∑njk=ni-ln-lnk-0.5n2,Φ11=∑njk=ni-xkln-lnk-0.5n 参数n表示样本数量,基于样本数量和渐进分布的收敛速度不同,适度选取参数n1,n2,n3,n4。对于右尾分布,可以

文档评论(0)

1亿VIP精品文档

相关文档