上博弈的分类智能控制.PDFVIP

下载本文档

5
0
约4.7千字
约 20页
2019-03-01 发布于天津
举报

上博弈的分类智能控制.PDF

上博弈的分类智能控制

智能控制第二讲(上)：博弈的分类吴建设博弈的分类 • 1、合作博弈与非合作博弈 • 2、完全信息博弈与不完全信息博弈 • 3、静态博弈与动态博弈 • 相互组合：完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。 • 4、纯策略博弈与混合策略博弈 1、合作博弈与非合作博弈 • 合作博弈：合作博弈亦称为正和博弈，是指博弈双方的利益都有所增加，或者至少是一方的利益增加，而另一方的利益不受损害，因而整个集体的利益有所增加。 • 合作博弈研究人们达成合作时如何分配合作得到的收益，即收益分配问题。合作博弈采取的是一种合作的方式，或者说是一种妥协。 • 至于收益在博弈各方之间如何分配，取决于博弈各方的力量对比和技巧运用。因此，妥协必须经过博弈各方的讨价还价，达成共识，进行合作。 1、合作博弈与非合作博弈 • 合作博弈存在的两个基本条件是： (1)对联盟来说，整体收益大于其每个成员单独经营时的收益之和。 (2)对联盟内部而言，应存在具有帕累托改进性质的分配规则，即每个成员都能获得比不加入联盟时多一些的收益。 1、合作博弈与非合作博弈合作博弈的例子：  OPEC （国际石油输出国组织），合作限产来共同增加利润。他们控制了绝大部分石油储量，谁不遵守组织内部协定，就予以一定制裁。  假如一个区域里有沃尔玛、家乐福、红旗、家润多、人人乐几个大型超市。由于太集中了，经常打促销战，造成销售净利率下降。为此，他们组成一个价格联盟来限制各自竞争行为。然后设置了一个惩罚机制。 1、合作博弈与非合作博弈 • 非合作博弈：在参与人利益相互冲突中如何选择策略使自己的收益最大，即策略选择问题。是一种不可能达成具有约束力的协议的博弈类型。 • 零和博弈、负和博弈是非合作博弈。 • 囚徒困境是非合作博弈。 1、合作博弈与非合作博弈  囚徒困境是非合作博弈。 D C D C P P T S -5 -5 0 -10 D D S T R R -10 0 -1 -1 C C TRPS, 2RT+S 如果将囚徒困境博弈中的参数改成：RT，会怎样？ 2、完全信息博弈与不完全信息博弈 • 完全信息博弈：是指每一参与者都拥有所有其他参与者的特征、策略及收益函数等方面的准确信息的博弈。 • 不完全信息博弈，参与人并不完全清楚有关博弈的一些信息。 2、完全信息博弈与不完全信息博弈 • 不完全信息博弈的例子： – 讨价还价中，买主不知道卖主的最低要加，卖主也不知道买主的最高出价； – 参与投标的各个厂商不知道其它人的出价； – 二手车市场，买家不知道车的真实情况； – 二人竞争一个工作岗位，彼此不知道对方情况； 3、静态博弈与动态博弈 • 静态博弈：是指博弈中参与者同时采取行动，或者尽管参与者行动的采取有先后顺序，但后行动的人不知道先采取行动的人采取的是什么行动。 • 例子：囚徒困境是静态博弈 3、静态博弈与动态博弈 • 动态博弈：动态博弈(dynamic game)是指参与人的行动有先后顺序，而且行动在后者可以观察到行动在先者的选择，并据此作出相应的选择。 • 不同的

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

上博弈的分类智能控制.PDFVIP