上博弈的分类智能控制.PDFVIP

  • 5
  • 0
  • 约4.7千字
  • 约 20页
  • 2019-03-01 发布于天津
  • 举报
上博弈的分类智能控制

智能控制 第二讲(上):博弈的分类 吴建设 博弈的分类 • 1、合作博弈与非合作博弈 • 2、完全信息博弈与不完全信息博弈 • 3、静态博弈与动态博弈 • 相互组合: 完全信息静态博弈、完全信息动态博弈、 不完全信息静态博弈、不完全信息动态博 弈。 • 4、纯策略博弈与混合策略博弈 1、合作博弈与非合作博弈 • 合作博弈:合作博弈亦称为正和博弈,是指博弈双 方的利益都有所增加,或者至少是一方的利益增加, 而另一方的利益不受损害,因而整个集体的利益有所 增加。 • 合作博弈研究人们达成合作时如何分配合作得到的收 益,即收益分配问题。合作博弈采取的是一种合作的 方式,或者说是一种妥协。 • 至于收益在博弈各方之间如何分配,取决于博弈各方 的力量对比和技巧运用。因此,妥协必须经过博弈各 方的讨价还价,达成共识,进行合作。 1、合作博弈与非合作博弈 • 合作博弈存在的两个基本条件是: (1)对联盟来说,整体收益大于其每个成员单 独经营时的收益之和。 (2)对联盟内部而言,应存在具有帕累托改进 性质的分配规则,即每个成员都能获得比 不加入联盟时多一些的收益。 1、合作博弈与非合作博弈 合作博弈的例子:  OPEC (国际石油输出国组织),合作限产来共同增 加利润。他们控制了绝大部分石油储量,谁不遵守组织 内部协定,就予以一定制裁。  假如一个区域里有沃尔玛、家乐福、红旗、家润多、人 人乐几个大型超市。由于太集中了,经常打促销战,造 成销售净利率下降。为此,他们组成一个价格联盟来限 制各自竞争行为。然后设置了一个惩罚机制。 1、合作博弈与非合作博弈 • 非合作博弈:在参与人利益相互冲突中如 何选择策略使自己的收益最大,即策略选 择问题。是一种不可能达成具有约束力的 协议的博弈类型。 • 零和博弈、负和博弈是非合作博弈。 • 囚徒困境是非合作博弈。 1、合作博弈与非合作博弈  囚徒困境是非合作博弈。 D C D C P P T S -5 -5 0 -10 D D S T R R -10 0 -1 -1 C C TRPS, 2RT+S 如果将囚徒困境博弈中的参数改成:RT,会怎样? 2、完全信息博弈与不完全信息博弈 • 完全信息博弈:是指每一参与者都拥有所 有其他参与者的特征、策略及收益函数等 方面的准确信息的博弈。 • 不完全信息博弈,参与人并不完全清楚有 关博弈的一些信息。 2、完全信息博弈与不完全信息博弈 • 不完全信息博弈的例子: – 讨价还价中,买主不知道卖主的最低要加,卖 主也不知道买主的最高出价; – 参与投标的各个厂商不知道其它人的出价; – 二手车市场,买家不知道车的真实情况; – 二人竞争一个工作岗位,彼此不知道对方情况; 3、静态博弈与动态博弈 • 静态博弈:是指博弈中参与者同时采取行 动,或者尽管参与者行动的采取有先后顺 序,但后行动的人不知道先采取行动的人 采取的是什么行动。 • 例子: 囚徒困境是静态博弈 3、静态博弈与动态博弈 • 动态博弈:动态博弈(dynamic game)是指参与人的行动有先后顺 序,而且行动在后者可以观察到行动在先者的选择,并据此作出 相应的选择。 • 不同的

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档