DistributedAlgorithm輪講13–14章.pptVIP

  • 4
  • 0
  • 约4.73千字
  • 约 35页
  • 2017-01-12 发布于天津
  • 举报
DistributedAlgorithm輪講13–14章

Distributed Algorithm 輪講 13 章 米澤研究室修士2年 小林 義徳 Why Fault-tolerant Algorithm? 単一プロセッサシステム+逐次アルゴリズム fault-tolerant にできることが限られている。 分散システム ~ partial-failure property 故障が起こっても、一部のみ影響を受ける 全体の故障より、段階的な悪化が望まれる。 故障したコンピュータの仕事を、残りの部分が代わりにやることが必要になる。 Fault tolerance Robust Algorithm 部分的、半永久的故障に耐性 Stabilizing Algorithm 全体的、一時的故障に耐性 Robust Algorithm 実行の途中で 故障があっても、全体としてずっと正しい振る舞いをしつづける。 以下、プロセスのみが故障し、通信路は常に正常であるとする。 しかし、failure 数の上限がある Failure model が正確に分かるべし この本でのFailure Model(p.429) Initially dead processes 1 step も local アルゴリズムを実行しない Process の crash 有限 step 正しく実行し、その後のステップを実行しない Byzantine behavior Local algorithm とは違う、デタラメなステップを実行 Byzantine process は、デタラメなメッセージをsend する The hierarchy of fault models Decision Problems Decision に対する 3 つの要求 Termination 正しいプロセスは、必ず結果を output する。 Consistency 全てのプロセスの output 間で、一貫性がとれていること(後述) Non-triviality 他のプロセスと通信せず、固定された出力をするアルゴリズムは考えない Decision Problems - Consistency 例 Consensus problem では、全ての正しいプロセスの出力が一致 Election problem では、一つのプロセスのみ出力 “1”、他のプロセスの出力 “0” Stabilizing Algorithm どんな Failure がどれだけの数起こっても OK しかし、正しい振る舞いに戻るのにいくらか時間がかかる。 Robust v.s. Stabilizing Stabilizing 例えば、宇宙船に大量の宇宙線がきて、 global configuration が一時的に駄目になっても、立ち直れる。 Robust 一部の限られた要素が永久に故障 一時的なサービスの停止が許されない場合に使われる。 この本に載っていないこと Refinement of synchrony assumptions Determination of solvable tasks Complexity of fault tolerance Dynamic systems and group membership Communication using shared variables Wait-free synchronization Overview of Chapter 14 - 16 14 章: Asynchronous system での Robustness について。 15 章: Synchronous system,Robustness Synchronous system では、確実な Failure Detection ができ、より高いレベルの robustness が達成可能。 16 章: Failure Detection Distributed Algorithm 輪講 14 章 米澤研究室修士2年 小林 義徳 予備知識 Consensus Problem 全てのプロセスの決定が一致 Election Problem プロセスの中から、リーダーを一つ選出 14 章の流れ 14.1 Impossibility of Consensus 非同期、決定的 1-crash-robust consensus protocol ない。 14.2 ,14.3 14.2 Fault を Initially dead process に制限することにより、consensus と election ができるようになる。 14.3 consensus よりプロセス間の連携が弱い問題で、crash model でも解けるものがある

文档评论(0)

1亿VIP精品文档

相关文档