- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
完全信息静态博弈讲义
* * 小偷和守卫的博弈 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 加重对首位的处罚:短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略 0 - D - D’ 守卫 得益((睡) S Pt 小偷 偷的概率 1 2.3.1 概念的提出 * * V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒 0 - P - P’ 小偷 得益(偷) V Pg 守卫 睡的概略 1 小偷和守卫的博弈 猜硬币博弈 猜硬币方 正面 反面 盖 硬 正面 币 方 反面 该博弈与上一个例子相似,即取胜的关键都是不 能让另一方猜到自己的策略而同时自己又要尽可能猜出对方的策略。若p1/2,则猜硬币方全猜正面,他的期望得益为p×1+(1-p) ×(-1)=2p-10,即平均来说,猜硬币方赢多输少。 -1,1 1,-1 1,-1 -1,1 例2 猜硬币 1.若被对手事先知道出现哪一面,肯定输 2.若正面出现的概率为p,负面为1-p,且p0.5,则猜正面的话赢的几率就比较大。 2.3.1 概念的提出 * * 混合策略反应函数 猜硬币博弈 -1, 1 1, -1 1, -1 -1, 1 正 面 反 面 猜硬币方 正面 反面 猜硬币博弈 盖 硬 币 方 r q 1 1 1/2 1/2 (r,1-r):盖硬币方选择正反面的混合策略概率分布 (q,1-q):猜硬币方选择正反面的混合策略概率分布 * * 混合策略反应函数 猜硬币博弈 -1, 1 1, -1 1, -1 -1, 1 正 面 反 面 猜硬币方 正面 反面 猜硬币博弈 盖 硬 币 方 r q 1 1 1/2 1/2 (r,1-r):盖硬币方选择正反面的混合策略概率分布 (q,1-q):猜硬币方选择正反面的混合策略概率分布 2.3.1 概念的提出 特点: 1.自己的选择不能让对手预先知道 2.若重复多次,则不让对手发现其中的规律。除非有意输(一种行贿的手段),注意行贿只是一个手段,有意无意间让对手了解自己的策略或规律。 2.3.1 概念的提出 定义:在博弈G={s1,…,sn;u1,…un}中,博弈方i的策略空间为Si={si1,…,sik},则博弈方i以概率分布pi=(pi1,…,pik)随机选择其k个可选策略称为一个“混合策略”,其中0≤pik≤1对k=1,…,k都成立且pi1+…+pik=1。 相对于这种以一定概率分布在一些策略中随机选择的混合策略,确定性的具体的策略我们称为“纯策略” 混合策略的原则: 自己的策略选择不能被另一方预知或猜到。即在决策时利用随机性。 选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性的倾向某一策略而占上风。 2.3.2 应用 博弈方1选A、B的概率:pA,pB; 博弈方2选C、D的概率:pC,pD。 原则应用:博弈方1选A和B的概率pA和pB一定 要使博弈方2选C的期望得益和选D的期望得益 相等。即 pA× 3 + pB×1= pA× 2 + pB×5 又由pA+ pB=1,可得 pA=0.8, pB=0.2,此即博弈方1应选的混合 策略。 同理可得博弈方2的混合策略为 pC=0.8, pD=0.2。 纳什均衡:1(0.8,0.2),2(0.8,0.2) 期望得益:u1e= pA. pC. u1(A,C)+ pA. pD. u1(A,D) + pB. pC. u1(B,C)+ pB. pD. u1(B,D)=2.6 u2e=2.6 单独一次博弈的结果可能是四种状态的任何一种,然而多次独立重复博弈得到如上的结果是可能的。 2,3 5,2 3,1 1,5 2 C D A 1 B 2.3.2 应用 混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题,同样可应用于存在多个纯策略纳什均衡的博弈问题。 例 夫妻之争 该博弈与上一个博弈的不同之处在 于每一方所希望对方
文档评论(0)