完全信息静态博弈讲义.pptVIP

下载本文档

4
0
约7.38千字
约 31页
2018-05-19 发布于河北
举报
版权申诉

完全信息静态博弈讲义.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

完全信息静态博弈讲义

* * 小偷和守卫的博弈 V，-D -P，0 0，S 0，0 睡不睡偷不偷守卫小偷加重对首位的处罚：短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职，但会降低盗窃发生的概略 0 - D - D’ 守卫得益((睡) S Pt 小偷偷的概率 1 2.3.1 概念的提出 * * V，-D -P，0 0，S 0，0 睡不睡偷不偷守卫小偷加重对小偷的处罚：短期内能抑制盗窃发生率长期并不能降低盗窃发生率，但会是的守卫更多的偷懒 0 - P - P’ 小偷得益(偷) V Pg 守卫睡的概略 1 小偷和守卫的博弈猜硬币博弈猜硬币方正面反面盖硬正面币方反面该博弈与上一个例子相似，即取胜的关键都是不能让另一方猜到自己的策略而同时自己又要尽可能猜出对方的策略。若p1/2,则猜硬币方全猜正面，他的期望得益为p×1+(1-p) ×(-1)=2p-10,即平均来说，猜硬币方赢多输少。 -1,1 1,-1 1,-1 -1,1 例2 猜硬币 1.若被对手事先知道出现哪一面，肯定输 2.若正面出现的概率为p，负面为1-p，且p0.5，则猜正面的话赢的几率就比较大。 2.3.1 概念的提出 * * 混合策略反应函数猜硬币博弈 -1， 1 1， -1 1， -1 -1， 1 正面反面猜硬币方正面反面猜硬币博弈盖硬币方 r q 1 1 1/2 1/2 (r,1-r)：盖硬币方选择正反面的混合策略概率分布 (q,1-q)：猜硬币方选择正反面的混合策略概率分布 * * 混合策略反应函数猜硬币博弈 -1， 1 1， -1 1， -1 -1， 1 正面反面猜硬币方正面反面猜硬币博弈盖硬币方 r q 1 1 1/2 1/2 (r,1-r)：盖硬币方选择正反面的混合策略概率分布 (q,1-q)：猜硬币方选择正反面的混合策略概率分布 2.3.1 概念的提出特点： 1.自己的选择不能让对手预先知道 2.若重复多次，则不让对手发现其中的规律。除非有意输（一种行贿的手段），注意行贿只是一个手段，有意无意间让对手了解自己的策略或规律。 2.3.1 概念的提出定义：在博弈G={s1,…,sn;u1,…un}中，博弈方i的策略空间为Si={si1,…,sik}，则博弈方i以概率分布pi=(pi1,…,pik)随机选择其k个可选策略称为一个“混合策略”，其中0≤pik≤1对k=1,…,k都成立且pi1+…+pik=1。相对于这种以一定概率分布在一些策略中随机选择的混合策略，确定性的具体的策略我们称为“纯策略” 混合策略的原则：自己的策略选择不能被另一方预知或猜到。即在决策时利用随机性。选择每种策略的概率一定要恰好使对方无机可乘，即让对方无法通过有针对性的倾向某一策略而占上风。 2.3.2 应用博弈方1选A、B的概率：pA，pB；博弈方2选C、D的概率：pC，pD。原则应用：博弈方1选A和B的概率pA和pB一定要使博弈方2选C的期望得益和选D的期望得益相等。即 pA× 3 ＋ pB×1＝ pA× 2 ＋ pB×5 又由pA＋ pB＝1，可得 pA＝0.8， pB＝0.2，此即博弈方1应选的混合策略。同理可得博弈方2的混合策略为 pC＝0.8, pD＝0.2。纳什均衡：1（0.8，0.2），2（0.8，0.2）期望得益：u1e＝ pA. pC. u1（A，C）＋ pA. pD. u1（A，D）＋ pB. pC. u1（B，C）＋ pB. pD. u1（B，D）＝2.6 u2e＝2.6 单独一次博弈的结果可能是四种状态的任何一种，然而多次独立重复博弈得到如上的结果是可能的。 2，3 5，2 3，1 1，5 2 C D A 1 B 2.3.2 应用混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题，同样可应用于存在多个纯策略纳什均衡的博弈问题。例夫妻之争该博弈与上一个博弈的不同之处在于每一方所希望对方