博弈论基础演示文稿.pptVIP

下载本文档

11
0
约3.24万字
约 244页
2018-12-04 发布于上海
举报
版权申诉

博弈论基础演示文稿.ppt

1、本文档共244页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈论基础演示文稿

An introduction toGame Theory 博弈论基础启示：博弈的划分：静态博弈经常是一次性的行为，决策一旦作出就不能再更改结果。动态博弈有一个重复的性质，前边的所有信息影响到后边的决策，博弈的结果要经过多次博弈之后才能看到，所以是一个连续的过程，这就决定了同一参与者在动态博弈时和静态博弈时表现出不同的行为。如果把为人处世看作一个博弈过程，我们就会发现静态博弈和动态博弈的区别。比如说一个坏人，他遇到了一个他从来都没遇到过的人而且以后再也不会和他见面的陌生人，他就可能会变得肆无忌惮，本来的面目暴露无遗，因为这种情况是静态博弈，是一锤子买卖。同样一个坏人又会在经常打交道的人面前伪装成好人，因为这种情况是动态博弈，前边的所有信息会影响到后边的决策。为了自己的长远利益，他现在必须极力制造一些虚假的信息，让后边的决策对自己更加有利，所以见面时会很客气，表现得很好，以便让别人后边的行动不要对自己不客气。例：猎人与猎狗的博弈第三章完全且完美信息的动态博弈本章讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型. 如果各方对各种局势下所有局中人的得益状况完全清楚,称为完全信息博弈。反之为不完全信息博弈。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈。反之称为“不完美信息的动态博弈”。由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果。本章分六节 3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论 3.1 动态博弈的表示法和特点 3.1.1 阶段和扩展性表示 3.1.2 动态博弈的基本特点 3.1.1 阶段和扩展性表示阶段：动态博弈中一个博弈方的一次选择行为例子：仿冒和反仿冒博弈 3.1.2 动态博弈的基本特点策略是在整个博弈中所有选择、行为的计划结果是上述“计划型”策略的策略组合，构成一条路径得益对应每条路径，而不是对应每步选择、行为动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利，有“先行优势”。 1.1.2.1动态博弈扩展式表述一般以扩展型式来表示：G=(N,H,P,I,U)，包括5要素：（1）局中人N；（2）历史H:博弈树是一个多环节与枝干的集合，从单一的起始环节，直到终结环节，代表博弈历史；（3）对每个环节的分配法则P:将每个环节（除终结环节外）分配给不同的局中人，并赋予行动时可选的策略；（4）局中人行动时的信息集合I；（5）对应局中人可能选择策略，各局中人在终结环节所得到的报酬U。博弈的扩展式表述包括三个要素: 参与人集合每个参与人的战略集合由战略组合决定的每个参与人的支付动态博弈的基本构造 1．结(nodes)：结包括决策结(decition nodes)和终点结(terminal nodes)两类。决策结是参与人采取行动的时点，终点结是博弈行动路径的终点。在博弈树中，“谁在什么时候行动”用在决策结旁边标注参与人的办法来表示。参与人的支付标注在博弈树终点结处。 2．枝(branches)：在博弈树上，枝是从一个决策结到它的直接后续结的连线，每一个枝代表参与人的一个行动选择。 3．信息集(information sets)：博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集。该子集包括所有满足下列条件的决策结：(1)每一个决策结都是同一参与人的决策结；(2)该参与人知道博弈进入该集合的的某个决策结，但不知道自己究竟处于哪一个决策结。例：“人不犯我，我不犯人；人若犯我，我必犯人”的动态表示 3.1.2.2 动态博弈的战略式表述练习：扩展式表述动态博弈若A先行动，B在知道A的行动后行动，则A有一个信息集，两个可选择的行动，战略空间为:(开发，不开发）； B有两个信息集，四个可选择的行动，B有四个纯战略：开发策略：不论A开发不开发，我开发；追随策略：A开发我开发，A不开发我不开发；对抗策略：A开发我不开发，A不开发我开发；不开发策略：不论A开发不开发我不开发简写为：（开发，开发），（开发，不