- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概述 分布式系统是互相通信的自治计算机结点的集合 模块性、并行性和自治性 适合于容错技术: 所有资源都可以冗余,包括CPU、存储器、I/O接口以及数据和控制 良好的可扩展性,系统的冗余程度可以随应用要求和环境变化进行动态调整 系统资源在物理上分开,从根本上避免了由于局部故障引起系统的全面崩溃 高速可靠的通信子网、资源的分散控制,消除了在单处理机或多处理机中存在的竞争、数据流的瓶颈和控制的关键点 分布式系统的系统级故障诊断技术 基本思想 首先让系统中的处理机相互测试,然后对测试结果进行分析,进而找出处理机和链路的故障 对系统进行诊断,如果没有正常节点机被错诊为故障结点机,则认为该诊断是正确的。如果诊断中能把所有故障结点机都诊断出来,则认为该诊断是完全的。一个诊断方法的分辨率是指它所执行的诊断中完全正确诊断所占的百分比 测试诊断模式 二值模型 结点机的状态和测试结果都只有两种取值 概率模型 用概率参数来描述故障结点机和无故障结点机的特性 多值模型 结点机的状态多于两种取值 测试策略 系统及故障诊断的测试策略 非自适应测试策略 一次性选取并执行全部测试 自适应测试策略 每次只选择并执行一部分测试,根据前面的结果合理地选择后面的测试 概率诊断 概率诊断不要求正确完成诊断任务,只要求高概率地识别出系统中的故障结点机 优点:诊断开销低,分辨率随系统中处理机数目的增多而提高,更适用于大规模系统 测试信息的分类 利用整个系统的测试信息 利用本地测试信息和前面步骤已诊断出的故障结点机来诊断结点的状态 只利用本地信息来确定每一个节点机的状态 集中式诊断 诊断任务由系统中的一台中心结点机完成,由它负责对处理机间相互测试的结果进行收集并进一步作出诊断,以识别各结点机的状态 t个故障一步诊断算法 前提:无故障机所作的测试结果是可靠的,故障机测试结果不可靠 t个故障一步诊断的充分必要条件:在n个处理机结点中,每个处理机至少要被t个其他处理机测试,并且任意两处理机之间不能相互测试 测试数大于等于nt 分布式诊断 将诊断任务分散给各结点机来独立完成,使得诊断完成后,系统中的每台无故障结点机都能正确地识别出其它所有结点机的状态,从而无故障结点机可通过忽略来自故障结点机的信息,并且不向故障结点机发送信息来实现功能上的“故障隔离” 分布式诊断 故障检测 发现结点机故障,通常利用结点机内部的自测试机制和结点机之间的互测试 信息传播 传播诊断信息,包含检测结果 协同 保证在系统的一次诊断过程中系统地所有无故障结点机所接受到的诊断信息都是相同的 诊断 利用诊断信息来判断系统各结点机的故障状态并定位故障结点机 Byzantine generals problem 1982年Lamport, Shostak, Pease提出 拜占庭帝国就是5~15世纪的东罗马帝国,拜占庭即现在土耳其的伊斯坦布尔。当时,拜占庭军队有许多分支,驻扎在敌人城外,每一分支由各自的将军指挥。将军们只能靠通讯员进行通讯。在观察了敌人以后,忠诚的将军们必须制订一个统一的行动计划。然而,这些将军中有叛徒,他们不希望忠诚的将军们能达成一致,因而影响统一行动计划的制订与传播。问题是:将军们必须有一个算法,使所有忠诚的将军们能够达成一致,而且少数几个叛徒不能使忠诚的将军们做出错误的计划。 Byzantine generals problem 解决拜占庭将军问题的算法必须保证 所有忠诚的将军必须基于相同的行动计划做出决策 忠诚的将军按算法的要求行动,而叛徒则按他们自己的意志行动。算法要保证不管叛徒怎么做,条件A都能得到保证。忠诚的将军们不但要能达成一致,而且要同意一个合理的计划。 少数叛徒不能使忠诚的将军做出错误的计划 这一条是很难做到的,因为“错误的计划”很难形式地加以定义 Byzantine generals problem 在进行混乱真实消息的传播中 两个将军中一个判国,另一个肯定打败仗; 三个将军中如果有一个判国,则判国的将军一定有办法让两个爱国的将军不能达成一致 4个将军中如果只有一个判国,在不知道谁是判国者的情况下,存在一种算法使将军们达成一致,实际上就是三个爱国的将军能够达成一致,而不管判国的将军如何捣乱。即4个将军的团体能够容忍1个叛国将军。 Byzantine generals problem 当有t个判国者在捣乱而又无法找出他们的时候,存在一种算法或称做弹性协议,通过这种协议,能够保证爱国的将军达成一致。如果我们把能够容忍t个叛国者的协议叫t弹性协议, 学者已证明:不存在3t个将军下的t弹性协议而一定存在3t+1或以上将军下的t弹性协议。就是说要有3t+1个或以上将军才能保证爱国的将军能够达成一致。既要想容忍t个判国者,必须保证总的将军的个数大于3t。 现实意义 对于系统坏掉的风
您可能关注的文档
- 八年级物理物质性质初步认识).ppt
- 办公用品申购制度和流程.pdf
- 半挂汽车列车操纵稳定性仿真分析.pdf
- 包装容器租赁共享模式研究.pdf
- 北京林业大学 2009年 数据库原理及应用(数据库技术)考试大纲 考试内容 复习参考书 考研辅导.pdf
- 北宋中后期解盐政策_郭正忠.pdf
- 北邮-网络管理及控制技术-阶段作业2.doc
- 北语网院15秋《数据库系统及应用》作业3.doc
- 变量赋初值算术运算符和表达式.doc
- 变量及赋值、循环结构.ppt
- DB23_T 3866-2024冰上龙舟赛事组织服务规范.docx
- DB32 2163-2012 棉纱单位可比综合电耗限额及计算方法.docx
- DB32∕T 2429-2013 棉花田间生长发育观察记载规范.docx
- DB23_T 3820-2024 工业互联网综合平台数据质量管理规范.docx
- DB23_T 3474-2023非煤智慧矿山信息系统技术规范.docx
- DB3201_T 1106-2022 工程地质层划分技术规范.docx
- DB33T 2515-2022公共机构“零碳”管理与评价规范.docx
- DB3301_T 0415-2023 装修垃圾收运处置管理规范.docx
- DB3311/T 106―2019“丽水山居”民宿服务要求与评价规范.docx
- DB3201T 1127-2022 慈善捐赠受赠管理规范.docx
文档评论(0)