博弈论和对策行为培训教材.pptVIP

  • 1
  • 0
  • 约7.54千字
  • 约 73页
  • 2018-10-17 发布于天津
  • 举报
博弈论和对策行为培训教材.ppt

第十一章 博奕论和对策行为 ;博弈论和对策行为 ;博弈论和对策行为 ;博弈论和对策行为 ;博弈论和对策行为 ;博弈论和对策行为 ;三.支付或收益(payoffs): ;例1. 囚徒困境(prisoner’s dilemma) ;例1. 囚徒困境(prisoner’s dilemma) ;例1. 囚徒困境(prisoner’s dilemma) ;定义1: 给定其它局中人的策略s,局中人i的最优反应 记为s,是指能给他带来最大收益的策略,即 ;定义2: 一个策略组合s*=(s1*,s2*,…,sn*)被称为纳什均 衡是指,对于所有 的 i, ; 在囚徒困境中,考虑囚徒A对他人的最优反应。如果给定囚徒B的策略是“坦白”,那么对囚徒A来说,采取“坦白”策略得到的收益是-8,采取“抵赖”策略得到的收益是-10,显然“坦白”为好;同理,如果给定囚徒B的策略是“抵赖”,对囚徒A来说,“坦白”也比“抵赖”好。因此,囚徒A对囚徒B的最优反应是“坦白”。 对囚徒B作同样分析:如果囚徒A的策略是“坦白”,则他采取“坦白”策略为好;如果囚徒A的策略是“抵赖”,他还是采取“坦白”策略好,所以囚徒B对囚徒A的最优反应也是“坦白”。 两个最优反应形成了一个策略组合(坦白,坦白),这就是一个纳什均衡。 ;

文档评论(0)

1亿VIP精品文档

相关文档