第8章 博弈论课程.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
四、混合策略和混合纳什均衡 (一)混合策略下的纳什均衡 定义2 在博弈 ,参与人i的策略集为 则他以概率分布 随机在其 个可选策略中选择的“策略”称为一个混合策略,其中 对j=1,…,k都成立,且 。 定义3 如果一个策略 中,参与人i的策略集为 ,如果由各个博弈方的策略组成策略集合 ,其中, 都是对其余博弈方策略组合的最佳策略,即 对任意 都成立,则称 为G的混合策略纳什均衡。 * * 第8章 博弈论 本章要点 了解博弈论的含义 掌握博弈的数学表示方法和纳什均衡的概念 掌握纯策略纳什均衡和混合策略纳什均衡的求解方法 第1节 博弈论基本概念 博弈论小故事 剪刀石头、齐王赛马 博弈的五个基本要素 参与人 (两人以上) 时序 (静态博弈、动态博弈) 策略及策略集 (行动的完整的策略) 支付及支付函数(零和博弈、费零和博弈) 信息 (完全信息、不完全信息) 博弈的数学模型 博弈模型由参与人、策略集、支付函数这三部分组成,数学符号表示如下: 具体过程如下:每个参与人都从自己的策略集合 选取策略 ,组成策略组合 把S代入代入每个参与人的支付函数 ,这样参与人i则获得自己 。 例8.1 猜硬币游戏 两个参加者甲、乙掷硬币,若两个硬币同正或同反,则甲得1分,乙付出1分;若一反一正,则乙得1分,甲付出1分。 甲、乙各有出示硬币的正面或反面两个策略 , 表示甲、乙出示正、反面。则策略组合为 两人的支付函数 ,则可得 例8.2.2 三人掷硬币游戏 规则 如全是正或全是反,则三人的支付为0。 如有两人正面,一人反面,则出反面的人扣2分,其余两人各得1分。 如有两人反面,一人正面,则出示正面的人扣2分,其余两人各得1分。 参与人集合 , 表示正面和反面。 策略组合表示为 , 表示为甲的支付函数; 则可得 同理可得 , 博弈的分类 第2节 完全信息静态博弈 概念:各博弈方同时决策,且所有博弈方对博弈中各种情况下的得益都完全了解的博弈。 纳什均衡:n人参加博弈, 表示策略集, 表示第i人的j个策略。hi 为i方的收益函数,函数表示为 定义1:在博弈 中,如果有由各个博弈方的各选取一个策略组成的某个策略组合 中,i方策略为 ,都是对其余策略方策略的组合 的最佳策略是 ,即 对任意 都成立,则称为一个纯策略纳什均衡。 例8.2 囚徒困境 一人以上供认就罪名成立; 都拒不认罪,则各判1年; 如一人坦白认罪,则坦白者立即释放而另一人将重判10年; 如果两人都坦白认罪,则将被各判8年。 分析: 两种策略:坦白、不坦白 用-1、-8、-10分别表示被判刑的得益,用0表示被释放的得益。 在此博弈中,最佳为坦白。 支付矩阵 囚徒1 囚徒2 坦 白 抵 赖 坦 白 -8, -8 0, -10 抵 赖 -10, 0 -1, -1 例8.3 村庄有3个农户,有一片可自由牧羊面积有限的公共草地; 只能满足有限数量的羊,超过这个限度,则羊的产出就会减少,甚至只能勉强存活或饿死; 假设这些农户春天同时做决策且不知其他人的

文档评论(0)

hushuidhd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档