博弈论(本科).docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论(本科)

博弈论 第一节、基本概念 定义: 是描述和研究行为者之间策略相互依存和相互作用的决策理论。 基本类型: 静态与动态 完全信息与不完全信息 基本要素: 参与者;策略;支付矩阵;顺序;概率。 第二节、基本的博弈策略 一、占优策略(静态、完全信息) 无论其他参与者采取什么策略,某参与者唯一的最优策略。 注意:不论是同时选择,还是先后选择,均衡结果是相同的。 不常见。 二、纳什均衡: 如果给定其他参与者的最优策略,某参与者的最优策略。 1、单一的纳什均衡(静态、完全信息) 海滩定位博弈(动态、完全信息) 2、两个纳什均衡(动态、完全信息) 3、经典模型与应用 智猪博弈:大股东与小股东;大户与散户;大企业与小企业等。 斗鸡博弈(两个纳什均衡):抢占市场;夫妻矛盾;两军对垒等。 三、最大最小策略: 最大化最小所得的策略。(静态、不完全信息) 保守,而非利润最大化。 对对手的“完全理性”或“完全信息”缺乏信心。 对手的错误选择将给自己造成严重后果。 案例:两厂商决策是否研发新产品,厂商1目前具有竞争优势。 投资博弈 万美元 厂商2 不投资 投资 厂商1 不投资 0,0 -10,10 投资 -100,0 20,10 厂商1的最大化最小策略。 厂商1如何最大化预期收益: 1无法确定2是否投资,但知道2不投资的可能性只有10%,1是否投资? 投资的预期收益:0.1×(-100)+0.9×20 = 8 不投资的预期收益:0.1×0+0.9×(-10)= -9 1应该投资。 如果1认为2不投资的可能性是30%,1是否投资? 投资的预期收益:0.3×(-100)+0.7×20 = -16 不投资的预期收益:0.3×0+0.7×(-10)= -7 1不应该投资。 四、混合策略(动态、不完全信息) 纯策略:参与者有一确定的最优策略。 混合策略:不存在确定的最优策略,参与者根据各种结果出现的概率, 以一定的概率随机选择各种策略。 零和博弈 每个人都想猜透对方的策略,而又不想让对方猜透自己的策略。 社会福利博弈 流浪汉 找工作 游荡 政府 救济 3, 2 -1, 3 不救济 -1, 1 0, 0 政府想救济流浪汉,但前提是你要找工作,但又不能区分每个流浪汉是否在找工作,因此只能统一对待。流浪汉只有在政府不救济时才会找工作。 政府的最优策略: 政府不可以选择救济或不救济的纯策略,因为流浪汉相应的策略使政府的效用降低。 政府应以某一概率选择救济(p)或不救济(1-p),使流浪汉找工作和游荡的预期效用相同。 p×2+(1-p)×1 = p×3+(1-p)×0 p=0.5 当政府救济与否的概率都是0.5时(混合策略),则流浪汉 找工作的预期效用:0.5×2+0.5×1=1.5; 游荡的预期效用:0.5×3+0.5×0=1.5; 流浪汉找工作或游荡(纯策略),或者以任何概率选择找工作和游荡(混合策略)的预期效用都一样。 这是政府的最优策略。因为,如果救济的概率大于不救济的概率,流浪汉游荡的预期效用大于找工作的预期效用,流浪汉会选择游荡(纯策略),政府也就要选择不救济(纯策略),流浪汉又找工作,政府又救济……,不能达成市场均衡。反之亦然。 流浪汉的最优策略: 流浪汉不可以选择找工作或游荡的纯策略,这会使政府选择相应的救济或不救济的纯策略使流浪汉的效用降低。 流浪汉应以某一概率选择工作(r)或游荡(1-r),使政府救济和不救济的预期效用相同。 r×3+(1-r)×(-1)=r×(-1)+(1-r)×0 r=0.2 当流浪汉找工作的概率是0.2,游荡的概率是0.8时,则政府 救济的预期效用:0.2×3+0.8×(-1)= -0.2; 不救济的预期效用:0.2×(-1)+ 0.8×0 = -0.2; 政府救济或不救济(纯策略),或者以任何概率选择救济和不救济(混合策略)的预期效用都一样。 这是流浪汉的最优策略。因为,如果找工作的概率大于0.2,政府救济的预期效用会大于不救济,政府会选择救济(纯策略),流浪汉又会游荡,政府又不救济……,不能形成均衡。反之亦然。 (3)纳什均衡: 政府与流浪汉博弈的最终结果是:政府以0.5的概率选择救济,以0.5的概率选择不救济;流浪汉以0.2的概率选择找工作,以0.8的概率选择游荡。 如果最初的策略组合不是这样,博弈的最终结果应该如此。 例如,政府救济的概率最初是0.2,则流浪汉 找工作的预期效用:0.2×2+0.8×1=1.2; 游荡的预期效用:0.2×3+0.8×0=0.6; 流浪汉找工作的预期效用大于游荡的预期效用,流浪汉是否一定找工作呢?流浪汉如果一定找工作,则政府就会救济,

文档评论(0)

qwd513620855 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档