不完全信息博弈分析.pptVIP

下载本文档

46
0
约 93页
2017-08-28 发布于重庆
举报
版权申诉

不完全信息博弈分析.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

不完全信息博弈分析完全信息与不完全信息不完全信息博弈问题 Static Bayesian Game(SBG) Dynamic Bayesian Game(DBG) 完全信息的一般表达式 G={S1,…,Sn；u1,…,un} n 个参与人博弈 Si 是player i 的策略集，即所有可选策略集 ui 是player i 的支付函数，且ui = ui(s1,,…sn) 求均衡解例如，Cournot Model G={S1,S2,u1,u2} S1={q1}，S2={q2} u1= u1 (q1,q2)=6q1-q1q2- q12 u2= u1 (q1,q2) =6q2-q1q2 -q22 反应函数求解法反应函数 Si*=R(S1*,…Si-1*,Si+1*,…Sn*) 即最佳策略之间的相互依存关系博弈的解（如果有解）就是各个反应函数的交点古诺博弈解的几何意义类似的例子反应函数的概念和思路可以应用到一般的无限多种策略博弈的求解中，可以使博弈问题的解法简约如Bertrand双寡头模型它与Cournot Model 不同的是，该模型中厂商的可选策略是价格而不是产量 Hotelling 价格竞争模型混合策略求解法这是一个零和博弈显著的特征最好的选择随机选择—— 按一定的概率分布选择自己的策略如何设计自己的概率分布？盖方设计：P{正面}=?，P{反面}=1- ? 如果?1-?（? 1/2)或?1-?(? 1/2)? 猜方的期望收益： E正面= ?·1+(1-?)·(-1)=2(?-1/2) E反面= ?·(-1)+(-?)·1=2(1/2-?) 最好的方法 E正面＝E反面，即?＝1/2 猜硬币博弈的Mixed Strategy 对盖方来说， ?＝1/2 猜方也以相同概率(?=1/2)随机选择策略在本博弈中博弈双方的决策内容都不是确定性的具体策略，而是以一定的概率分布随机选择策略，这样的决策被称为“混合策略”((1/2,1/2),(1/2,1/2)) 区别纯策略及纯策略纳什均衡混合策略及混合策略纳什均衡混合策略的定义在G={S1,…Sn;u1,…un}中，博弈方i 的策略为Si={si1,…sik} 则博弈方i以概率分布pi=(pi1,…pik)随机选择其k个可选择策略则这Pi就称为一个混合策略，其中0≤pij ≤1,j=1,…k都成立，且pi1+ · · ·pik=1. 混合策略决策的基本原则第一个原则不能让对方知道或猜到自己的选择，因而必须在决策时利用随机性。第二个原则他们选择每种策略的概率一定要恰好使对方无机可乘，即让对方无法通过有针对性地倾向某一策略而在博弈中占上风。斗鸡博弈如何设计？Ａ：?进＋?退＝１Ｂ：?进＋?退＝１期望值相等 A:EＢ进＝ＥＢ退 B:EＡ进＝ＥＡ退混合策略（?进，?退）（?进，?退）完全信息动态博弈的求解问题讨价还价博弈两人为买卖一物讨价还价Ｂ—最高出价300元Ｓ—最低出价200元双方报价在[200，300]中价差300-200=100元是一块“蛋糕” P∈[0，100]是个连续区间用逆推归纳法求解假定P2是共识 B先开出P1就知道S会反开出P2 B为了不让S反开出P2 则必须保证P1开出后 S的所得P1-200≥P2-200，就有P1=P2 这个Game的特点 S作为后开价者，享有“后动者优势” B与Ｓ只有一个轮回 B先开价 S接受就成交，S拒绝就Game Over. 显然，只要B开出的价格P1 ≥200元， S就会接受这在现实中是常见的。 P3是共识；第三阶段 ? (300-P2)≥?2( 300-P3) P2=300-300?+P3? 第二阶段 P1-200 ≥ ?( P2-200） P1=200+100? -(300-P3) ?2 本博弈的解：（300- P1 ，P1-200 ） 300- P1 =100-100?+300?2 P1-200=100?-300 ?2 - P3?2 启示日常生活中常见的现象买者B很想买下这件东西，卖者S处于有利地位卖者S急于出手这件东西，买者B处于有利地位这类讨价还价模型的预测结果与两个因素有关：先开价者和轮回次数如果B先开价且轮回次数为奇数，那么B将“几乎吃掉整块蛋糕” 如果B先开价且轮回次数为偶数，那么S将“几乎吃掉整块蛋糕” 重复博弈与无名氏定理动态博弈的类型序贯博弈sequential game 每一个阶段的博弈结构是不同的，即从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈。或者说，同样结构的博弈只出现一次。重复博弈repeated game 是指同样结构的博弈重复多次，其中的每次博弈