网站大量收购独家精品文档,联系QQ:2885784924

第一讲概念与方法.pptVIP

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一讲概念与方法.ppt

社会福利博弈:无纳什均衡 社会福利博弈的特征 不存在纳什均衡 类似:父母与啃老族 回望:另一个不正常的博弈 情侣博弈——两个纳什均衡 思考 如何分析“不存在”纳什均衡或存在多个纳什均衡的博弈? 第三章 混合策略纳什均衡 第一节 基本概念:混合策略与期望支付 第一节 混合策略与期望支付 一、混合策略 (一)案例:小偷与守卫的猫鼠博弈 守卫 睡 不睡 偷 小偷 不偷 小偷与守卫博弈 无纳什均衡,如何分析? 第一节 混合策略与期望支付 一、混合策略 (二)混合策略 1.表述 参与人按照一定概率,随机从策略组合中选择一种策略作为实际行动 随机行动的目的:使自己的行为不被对手预测 混合策略 小偷的混合策略 以p的概率偷,(p,1-p) 守卫的混合策略 以q的概率睡(q,1-q) 第一节 混合策略与期望支付 一、混合策略 (二)混合策略 2.相对概念:纯策略 每个参与人的非随机性选择 纯粹行动计划,p=100%,1-p=0 第一节 混合策略与期望支付 一、混合策略 (二)混合策略 3.数学刻画 给定博弈G={S1,…,Sn;u1,…,un}以及参与人i的纯策略Si= {si1,…,sik} 概率分布pi=(pi1,…,pik)为混合策略 其中:0≤ pik ≤1,∑ pik=1, pik=p( sik ) 混合策略组合p=(p1,…,pi,…pn) 第一节 混合策略与期望支付 二、期望支付 (一)分析 1.概率 (偷,睡)的概率:pq (偷,不睡)的概率:p(1-q) (不偷,睡)的概率:(1-p)q (不偷,不睡)的概率:(1-p)(1-q) 第一节 混合策略与期望支付 二、期望支付 (一)分析 2.期望支付 U小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1-p)(1-q)=2p(5q-1) U守卫= (-2) pq+0p(1-q)+8(1-p)q+0(1-p)(1-q)=2q(4-5p) 第一节 混合策略与期望支付 二、期望支付 (二)数学刻画 第一节 混合策略与期望支付 三、混合策略纳什均衡 给定策略式博弈G={S1,…,Sn;u1,…,un}以及混合策略组合p*=(p1*,…,pi*,…pn*) 对于所有i和pi∈∑i, ∑i——i的混合策略空间 如果有:πi(pi*,p-i*)≥πi(pi’,p-i*) 则:混合策略组合p*=(p1*,…,pi*,…pn*)为G的混合策略纳什均衡 第二节 研究方法:反应函数法 ——最佳反应函数曲线交叉法 一、案例:麦琪的礼物 Dela 剪发q 保留(1-q) 卖表p Jim 保留(1-p) 二、研究方法:反应函数法 二、期望支付 1.UJim=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2p(1-3q)+2q 整理原则:一项含p,一项不含p 2.UDel=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2q(1-3p)+2p 整理原则:一项含q,一项不含q 二、研究方法:反应函数法 三、反应函数 1.Jim:Dela剪发的概率越小,Jim卖表越好 UJim=2p(1-3q)+2q 二、研究方法:反应函数法 三、反应函数 2. Dela : Jim卖表的概率越小, Dela 剪发越好 UDel=2q(1-3p)+2p 二、研究方法:反应函数法 四、反应函数曲线 1.交点(1,0) 双方支付为2 2.交点(0,1) 双方支付为2 3.交点(1/3,1/3) 双方支付为2/3 作业 利用反应函数法求解“社会福利博弈” 是否需要调整数据? 可得出有关社会保障体系改革的结论? *博弈论第三章 第一讲 概念与方法 流浪汉 寻找工作 游荡 救济 政府 不救济 0,0 -1,1 -1,3 3,2 你救济,他就游荡;你游荡,他就不救济 0,0 0,8 -2,0 8,-2 0,0 2,2 2,2 -2,-2 q p 1 1/3 1/3 1 互相为对方着想,期望支付变小 *博弈论第三章 第一讲 概念与方法 * *

文档评论(0)

Ryanwh + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档