博弈论与决策行为.ppt

下载文档 降价啦

40
0
约2.77万字
约 173页
2017-09-20 发布于上海
举报
版权申诉
保障服务

博弈论与决策行为.ppt

1、本文档共173页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

博弈论与决策行为

哈桑尼转换：引入一个虚拟的参与人“自然”（nature），自然首先行动决定参与人的特征，参与人知道自己的特征，其他人不知道。这样，不完全信息博弈就转换成完全但不完美信息博弈（games of complete but imperfect information）。有了哈桑尼转换，不完全信息和不完美信息之间的区别就不重要了。不完全信息古诺模型参与人的类型是成本函数。假设逆需求函数为P = a-q1-q2，每个企业的单位成本不变，为ci，则企业的利润函数为： πi = qi (a-q1-q2-ci), i=1,2 假设企业1的单位成本c1是共同知识，企业2的单位成本可能是高的也可能是低的，企业2知道自己的成本类型，但企业1只知道企业2属于这两种类型的概率分布μ和1-μ，μ是共同知识。进一步假设 a=2，c1=1， =1.25， =0.75， μ=0.5 每个企业都要最大化自己的利润函数。企业2的利润函数为： π2 = q2(t-q1*-q2*) t=a-1.25=0.75或t=a-0.75=1.25，依赖于企业2的实际成本。从最优化的一阶条件可以得到企业2的反应函数为： q2*(q1,t)=0.5(t-q1) 企业2的最优产量水平不仅依赖于企业1的产量，而且依赖于自己的成本。令为企业2为高成本时的最优产量，为企业2为低成本时的最优产量，则有：企业1 不知道企业2的真实成本，因而不知道企业2的最优反应是还是，因此企业1的最优反应是选择q1以最大化自己的期望利润函数：解最优化的一阶条件得企业1的反应函数：当博弈参与人的反应函数同时成立时，我们得到该博弈的贝叶斯纳什均衡：将此结果与完全信息下的纳什均衡做一个比较，如果企业2是低成本的，即c2=0.75，企业1 对此完全知道，则两企业的反应函数分别为：纳什均衡产量为：类似的，如果企业2是高成本的，即c2=1.25，企业1 对此完全知道，则两企业的反应函数分别为：纳什均衡产量为：与完全信息情况相比，在不完全信息的情况下，低成本企业的均衡产量相对较低，而高成本企业的均衡产量要高一些。造成这个结果的原因是，由于企业1对企业2的真实成本不完全了解，只能根据对其成本类型的概率判断最大化自己的期望效用完全信息与不完全信息古诺模型的比较 R1 q2 q1 R2(H) R2(L) 完全信息下的纳什均衡结果不完全信息下的贝叶斯纳什均衡结果 2．5 不完全信息动态博弈：精炼贝叶斯纳什均衡 “自然”首先选择参与人的类型，参与人自己知道，其他参与人不知道。在自然选择后，参与人开始行动。由于行动有先后次序，后行动者可以观察到先行动者的行动。虽然参与人不能直接观测其他参与人的类型，但因为参与人的行动是类型依存的，每个参与人的行动都传递着有关自己类型的某种信息，后行动者可以通过观察先行动者所选择的行动获得有关后者偏好、战略空间等方面的信息，修正自己对其所属类型的先验概率判断，然后选择自己的行动。先行动者可以理性的预期到自己的行动将被后行动者所利用，就会设法传递对自己最有利的信息，而避免传递对自己不利的信息。因此，博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。精炼贝叶斯均衡的要点是：当事人要根据所观察到的他人的行为来修正自己关于后者类型的“信念”（主观概率），并由此选择自己的行动。这里，修正过程使用的是贝叶斯规则。其中A、B表示两个任意事件，P(非A)=1-P(A)，P(A)是事件A发生的事先概率，P(A∣B)称为事后概率，表示在B已经发生的条件下，事件A将发生的概率。例：如果我们把所有的人划分为好人（GP）和坏人（BP）两类，所有的事划分为好事（GT）和坏事（BT）两类。那么一个人干好事的概率等于他是好人的概率P（GP）乘以好人干好事的概率P（GT｜GP），加上他是坏人的概率P（BP）乘以坏人干好事的概率P（GT ｜BP）： P（GT）＝ P（GT｜GP）P（GP）＋ P（GT｜BP）P（BP）假设我们观察到一个人干了一件好事，那么，这个人是好人的后验概率为： P（GP ｜GT）＝ P（GT｜GP）P（GP）／P（GT）具体地说，假定张三是好人的先验概率是0.5, 那么，在观察到张三干了一就好事后，我们如何修正他是好人的先验概率依赖于我们认为这间好事好到什么程度。 1、这是一件非常好的好事，好人一定干，坏人