- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
互动博弈论——博弈论平话 2
第二部分 完全信息静态博弈 序 基本概念简介 一 两人有限零和对策问题的解法 二 两人有限变和对策问题的解法 序 基本概念:1 完全信息静态博弈的定义?2 博弈的策略式表达 ?3 博弈的得益矩阵表示 ?(博弈现象、博弈思想、博弈理论、博弈模型、博弈应用) 1 完全信息静态博弈 定义 所谓完全信息静态博弈指的是各博弈方同时决策,或者决策行动虽有先后,但后行动者不知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。 策略式表达又称为标准式表达,在这种表达中,所有参人同时选择自己的策略,所有参与人选择的策略一起决定每个参与人的得益。 值得强调的是,这里参与人同时选择的是“策略”,而不是“行动”。 在静态博弈中,由于参与人只选择一次,所以策略就等同于行动。而在动态博弈中,策略是参与人在各个阶段的行动的全面计划。 2 博弈的策略式表达 在博弈论中,一个博弈可以用两种不同的方式来表达: 一种是策略式表达:另一种是扩展式表达.策略式表达更适合于静态博弈,而扩展式表达更适合于讨论动态博弈。 策(战)略式的表述: 1、博弈的参与人集合:i∈Γ,Γ=(1,2,…, n); 2、每个参与人的战略空间:Si i=1,2,3,…,n; 3、每个参与人的得益函数:ui(s1, …,si…,sn),i=1,2,3, …,n。 用G={S1,…,Sn;u1, …,un}代表战略式表述博弈。 3 博弈的得益矩阵表示 一个博弈被称为有限博弈,如果: 第一,参与人的个数是有限的; 第二,每个参人可选择的策略个数是有限的。 有限博弈的策略式表达及其求解可以用得益矩阵直观地给出。 第二讲 完全信息静态博弈 序 基本概念简介 一 两人有限零和对策问题的解法 二 两人有限变和对策问题的解法 一 两人有限零和对策问题的求解(安全第一方法、优超法及其他解法) 两人有限零和对策——矩阵对策 1)局中人i,i∈I,I={1,2,…,n} 2)策略S,Si 如(上中下),(上下中),(中上下)等 … 3)赢得函数局势:局势 如s11= ,s12 = 等 全部集合局势: Hi(s),如齐王与田纪赛马H齐王(s11)=3; H田纪(s11)=-3 ***局中人、策略与赢得函数(支付函数)确定后,一个对策模型即确定。 对于两人有限零和对策,局中人I的赢得矩阵与局中人II的赢得矩阵相反。 矩阵对策常被记为:G={I,II;S1,S2;A} 案例: 求解方法之一:最小最大法——安全第一法 设有一矩阵对策,求均衡局势(对策) 矩阵对策的均衡局势(f,b) 规律:如有 则称使之成立的纯局势(ai*, bi* )为纯策略下的平衡局势(或解), ai*与 bi*分别为局中人I与II的纯策略。 含义:既是所在行的最小值,又是所在列的最大值。且(ai*, bi* )为鞍点。 案例: 当解不唯一时,解之间的关系有两个性质: 1)无差别性; 2)可交换性。 此时,局中人可以不依赖于其他人的纯策略,而选择构成解的最优策略。 作业1:求解下列矩阵对策 案例: 称G*={S1*,S2*,E}为对策G的混合扩充。E(x,y)=xTAy,此时的博弈均衡局势是使 使上式成立的(x*,y*)为G在混合策略意义下的解。 x*与y*为局中人的最优混合策略。 (鞍点不存在时)求解两人有限零和对策问题的方法之二——优超法 思考:混合战略的现实意义? 解得X3*=1/3,X4*=2/3 y1*=1/2,y2*=1/2 则原对策矩阵的一个解是: X*=(0,0,1/3,2/3,0) y*=(1/2,1/2,0,0,0) 期望赢得值为5 齐王与田纪赛马博弈的混合均衡 齐王的赢得矩阵: A没有鞍点,只有最优混合策略: X*=(1/6,1/6,1/6,1/6,1/6,1/6) y*=(1/6,1/6, 1/6,1/6,1/6,1/6) 对策的值
文档评论(0)