- 27
- 0
- 约5.06千字
- 约 16页
- 2018-11-23 发布于山东
- 举报
第三讲非合作博弈的解(2):混
合策略与混合策略均衡
如何理解“石头剪刀布”的解?
乙 石头 剪刀 布
甲
石头 0,0 1,-1 -1,1
剪刀 -1,1 0,0 1,-1
布 1,-1 -1,1 0,0
纯策略与混合策略概念:一个策略是纯策略指的是参与
人策略空间中的某个确定策略;而一个混合策略是参与
人策略空间上的一个概率分布。一般地,某个人i的策
略空间为{s ,s ,…,s },则参与人i在策略空间上的
i1 i2 ik
一个概率分布p =(p ,p ,…,p )构成他的一个混合策
i i1 i2 ik
略,其中p +p +…+p =1。
i1 i2 ik
混合策略体现了参与人选择纯策略的不确定性。
例:在 “石头-剪刀-布”中,某人以1/2的概率出石头、
1/4的概率出剪刀、1/4的概率出布便是一个混合策略。
混合策略又称随机策略。
在 《西游记》中,唐僧师徒一行去西天取经,4人各自
有自己的策略空间。在取经的过程中猪八戒的策略空间
为{西天取经,散伙(回高老庄)}。“采取西天取经”
或“采取回高老庄”是猪八戒的纯策略;而“70%的可
能性采取西天取经、30%的可能性回高老庄”为猪八戒
的一个混合策略。孙悟空也在采取混合策略,只不过
“西天取经”的概率比较高,回花果山的策略的概率低。
唐僧采取“西天取经”概率为百分百;沙僧采取“西天取
经”的概率也较高。这里的混合策略中的概率分布体现了
参与人采取某个策略的意志或忠诚程度。
博弈论的许多概念能够让我们以新的方式去理解事物,
并且会给我们以别样的感觉。混合策略的引入使博弈有
完美的数学解。然而,该概念自上世纪80年代一直被人
们认为 “直觉上有问题的”。混合策略的核心是随机性,
但它缺乏支持:人们怎么会通过投掷骰子来进行选择呢?
人们不会随身带着随机发生器以随机地确定所选择的策
略;并且以无理数的概率值,如/2、 /4,我们是无法精
确地产生它们的。
在博弈论专家那里,对于混合策略有三个解释:
第一,鲁宾斯坦(Ariel Rubinstein,1991)认为,混
合策略反映我们对参与人的信息和进行决策的过程没有
足够的知识;但这种解释不令人满意。
第二,想象一个进行同种博弈的参与人群体,混合策略
可解释成被选择的纯策略的分布;但这种解释不能说明
个体进行这样选择时的选择。
第三, 奥曼和布兰登伯格(Aumann and Brandenburger,
1995)将纳什均衡重新解释成信念中的均衡而不是行动中
的均衡:参与人对其他人采取各个策略的可能性的信念。
这种解释弱化了纳什均衡的解释力,因为这是可能的:
在这样的均衡中每个参与人实际上采取纯策略。但不管
如何混合策略的解释,其引入拓宽了我们的视野。
混合策略均衡案例:例3.5.田忌赛马。齐王与田忌进行
赛马比赛,因为田忌的马不如齐王的马,每次都是田忌
输掉比赛。孙膑被田忌从魏国救了出来,称为了他的谋
士。孙膑给田忌出了这样的主意:让田忌用自己的下等
马去与齐王的上等马比,用自己的上等马与齐王的中等
马比,用自己的中等马与齐王的下等马比。这样,田忌
的下等马输了,但是上等马和中等马赢了。在与齐王的
三场比赛中,田忌赢得了三场中的两场。因一次的赌金
是一千金,齐王输了一千金,而田忌赢得了一千金。
田忌赛马支付矩阵表
齐王 上中下 上下中 中上下 中下上 下上中 下中上
田忌
上中下 -3,3 - 1,1
您可能关注的文档
最近下载
- 020——《山经》河水下游及其支流考.pdf
- 新人教版小学六年级数学上册教学课件(全册).pptx VIP
- 安徽A10联盟2026届高三2月学情检测(开年考)数学试卷(含答案解析).pdf
- 中考语文 作文天津中考作文真题分析.pdf VIP
- 教学评一致性的研究.doc VIP
- DB23T1501-2013 水利堤(岸)坡防护工程格宾与雷诺护垫施工技术规范.pdf VIP
- 2025年学历类自考专业(国贸)国际商务英语-外贸英语写作参考题库含答案解析.docx VIP
- 智慧停车安全培训课件.pptx VIP
- 农村会计试题及答案解析.docx VIP
- 癌症患者生活质量量表EORTC QLQ-C30.docx VIP
原创力文档

文档评论(0)