完全信息静态博弈：基础理论9.ppt

下载文档

10
0
约7.4千字
约 49页
2018-06-21 发布于江苏
举报
版权申诉
保障服务

完全信息静态博弈：基础理论9.ppt

1、本文档共49页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

完全信息静态博弈：基础理论9

第一章完全信息静态博弈在本章中，我们讨论如下简单形式的博弈: 开始时由参与者同时选择行动，然后根据所有参与者的选择，每个参与者得到各自的结果(一定的收益或支出)。在此类静态(即各方同时行动)的博弈中，我们的分析又仅限于完全信息博弈的情况，即每一参与者的收益函数(根据所有参与者选择行动的不同组合决定某一参与者收益的函数)在所有参与者之间是共同知识 (common knowledge)。 1.1.A 基础理论:博弈的标准式和纳什均衡 1.1.A 博弈的标准式表述在博弈的标准式表述中，每一参与者同时选择一个战略，所有参与者选择战略的组合决定了每个参与者的收益。我们借一个经典的例子说明博弈的标准式——囚徒困境。囚徒困境：两个犯罪嫌疑人被捕并受到指控，但除非至少一个人招认犯罪，警方并无充足证据将其按罪判刑。警方把他们关入不同牢室，并对他们说明不同行动带来的后果。如果两人都不坦白，将均被判为轻度犯罪，入狱一个月;如果双方都坦白招认，都将被判入狱6个月;最后，如果一人招认而另一人拒不坦白，招认的一方将马上获释，而另一人将判入狱9个月——所犯罪行6个月，干扰司法加判3个月。囚徒面临的问题可用下图所示的双变量矩阵表来描述。 “双变量”指的是在两个参与者的博弈中，每一单元格有两个数字，分别表示两个参与者的收益。在此博弈中，每一囚徒有两种战略可供选择:坦白(或招认)、不坦白(或沉默). 在一组特定的战略组合被选定后，两人的收益由上图双变量矩阵中相应单元的数据所表示。习惯上，横行代表的参与者(此例中为囚徒1)的收益在两个数字中放前面，列代表的参与者(此例为囚徒2)的收益置于其后。博弈的要素：现在我们回到一般情况。博弈的标准式表述包括: （1）博弈的参与者；（2）每一参与者可供选择的战略集；（3）针对所有参与者可能选择的战略组合，每一个参与者获得的收益。考虑n个参与者的博弈：（1）参与者从1到n排序; （2）设其中任一参与者的序号为i，令Si代表参与者i可以选择的战略集合(称为i的战略空间)，其中任意一个特定的战略用si表示(有时我们写成，si∈Si表示战略si是战略集Si中的要素); （3）令(s1,...,sn)表示每个参与者选定一个战略形成的战略组合，ui表示第i个参与者的收益函数，ui (si,...,sn)即为参与者选择战略(s1,...,sn)时第i个参与者的收益。博弈的标准式表述将上述内容综合起来，我们得到: 定义在一个n人博弈的标准式表述中，参与者的战略空间为S1,…,Sn，收益函数为u1,…,un，我们用G={S1,…,Sn; u1,…,un}表示此博弈。同时选择战略的含义：尽管我们曾提到,在博弈的标准式中，参与者是同时选择战略的，但这并不意味着各方的行动也必须是同时的。只要是每一参与者在选择行动时不知道其他参与者的选择就足够了。像上例中牢里分开关押的囚徒，可以在任何时间作出他们的选择。更进一步，尽管在本章中博弈的标准式只用来表示参与者行动时不清楚他人选择的静态博弈，但标准式也可用来表示序贯行动的博弈，只不过另一种变通的方式——博弈的扩展式表述更为常用，它在分析动态问题时也更为方便。 1.1.B 重复剔除严格劣战略下面开始介绍如何着手分析一个博弈论问题。我们从囚徒的困境这个例子开始，因为它较为简单，只需用到理性的参与者不会选择严格劣战略这一原则。严格劣战略的定义：定义在标准式的博弈G={S1,…,Sn; u1,…,un}中，令si’和si”代表参与者i的两个可行战略(即si’和si”是Si中的元素)。如果对其他参与者每一个可能的战略组合，i选择si’的收益都小于其选择si”的收益，则称战略si’相对于战略si”是严格劣战略: ui(s1,…,si-1,si’,si+1,…,sn)ui(s1,…,si-1,si”,si+1,…,sn)对其他参与者在其战略空间S1,…, Si-1,Si+1,…, Sn中每一组可能的战略（s1,…,si-1,si+1,…,sn ）都成立。重复剔除严格劣战略均衡：理性的参与者不会选择严格劣战略，因为他〔对其他人选择的战略)无法作出这样的推断，使这一战略成为他的最优反应。这样，在囚徒的困境中，一个理性的参与人会选择招认，于是（招认，招认）就成为两个理性参与者的结果，尽管(招认，招认)带给双方的福利都比(沉默，沉默)要低。现在，我们来看理性参与者不选择严格劣战略这一原则是否能解决其他博弈问题。考虑图1.1.1所示抽象博弈的例子：重复剔除严格劣战略均衡的缺陷：上面的过程可称为 “重复剔除严格劣战略”。尽管此过程建立在理性参与人不会选择严格劣战略这一合情近理的原则之上，它仍有两个缺陷: 第一，每一步剔除都需要假定，参与者间相互了解。如