- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
在一局博弈N,V中,Shapley值由下式给出: 对于一个n人合作博弈N,V,存在唯一的一个向量函数 其中,|S|表示联盟S中人的个数,则 称为Shapley值。 Shapely法是一种期望边际收入思想。 表示由于局中人参加了联盟而带来的数值,即局中人i对联盟S的边际贡献,而 表示局中人参加S的概率。(局中人i在(N-S)个局中人前,(S-{i})个局中人之后参加S的概率。) 例7:该博弈的特征函数如下 V({1})=a V({2})= V({3})= V({2,3})=0 V({1,2})=b V({1,3})= V({1,2,3})=c 求Φi(V),先把包括局中人1的联盟抄列如下: S={1},{1,2},{1,3},{1,2,3} 4、多人结盟博弈的多目标决策方法 前面所述的多人博弈的各种解的方法,都具有各自的特点和各自的缺点,从理论上讲并不存在一个最优或最合理的解,多人结盟博弈的多目标决策方法,是吸收了核解法等的思想,将求解问题转化为一个多目标规划,从而各种有效的多目标决策方法均能使用于多人结盟博弈问题。 对一个多人博弈N,V,N={1,2,…,N},若把每个局中人的收益值视为一个目标函数,则此问题可看成n个目标的多目标决策问题,它的解是在核C(V)中或者仅在合理分配集I(V)中,多人博弈求解问题转为一个多目标规划: 使用二次规划方法(QP)来求解,具体步骤如下: (1)首先确定一个理想分配向量U=(u1,u2,……,un)其中ui为局中人i的理想分配数,可以局中人i在大联盟中的边际贡献值作为ui,Ui=V(N)-V(N-{i}) (2)求解二次规划 (3)若上述二次规划非可行解,转求下列LP问题。 得ε* 置 转(1) 此方法可称为“GQP”方法,它的解是指在距离意义上离理想分配向量最近,因此是在这种意义下的最优解。 第五章 多人合作博弈模型 一、问题引入 二、多人结盟博弈的基本概念 三、多人结盟博弈的解 四、常用解法 一、问题引入 例1 :(爵士乐队博弈,A Jazz Band Gounce) 一位歌手(S),一位钢琴家(P)和一位鼓手(D)组成一个小乐队在俱乐部同台演出能得到演出费1000元,若歌手和钢琴家一起演出能得800元。而只有钢琴家和鼓手一起演出能得到650元,钢琴独奏表演能得300元,钢琴家没有其它收入。然而,歌手和鼓手在地铁中表演能挣500元,歌手独奏可以从The Terasses 挣200元,而鼓手单独什么也挣不到。 问题:如何在这三人爵士乐队中合理分配共同演出费1000元? 例2: 成本分摊问题(A Cost Game) 三个城镇A,B,C欲与附近的一座电站连接起来,其可能的线路及其成本如下网络图表示: 这三个镇可相互联合建设,试问如何在这三个小镇合理分摊这笔建设费? A B C 二、多人结盟博弈的基本概念 多人结盟博弈:局中人多于二人时的博弈称为多人博弈。这种博弈中如果局中人可以和其它局中人联合成一体统一行动与其它局中人对抗,这种博弈称为多人结盟博弈。 这种博弈有三个基本要素: 局中人N={1,2,…,n}; 结盟S; 特征函数V(S)。 一般可用N,V表示一个多人结盟博弈。 1、局中人与结盟 (1) N={1,2,…,n}表示局中人集合。 (2)结盟S,表示一个联盟,即一局多人对 策中,一部份局中人联合成一体像一 个“局中人”一样选择策略,这种联合 称为结盟。显然结盟S是局中人集合N 的子集,S?N。 (3)2n是局中人可能形成结盟的个数。 2、特征函数 V(S) (1)V(S)表示当若干局中人联合成一个结盟S时,在这局博弈中能获得的最大收益值,即当形成结盟S,只要S内每一个局中人共同策略,选择相应策略结盟S能保证获得,而与联盟外局人采用什么策略无关。若S=?,V(?)=0。 (2)超可加性 若一个多人博弈的特征函数具有下列性质,即对任意结盟S,T ?N,S∩T= ? ,满足 V(S∪T)≥V(S)+V(T). 称这个多人博弈具有超可加性。 如果特征函数不满足超可加性,博弈中的结盟是不稳定的。 例1 :(爵士乐队博弈,A Jazz Band Gounce) 一位歌手(S),一位钢琴家(P)和一位鼓手(D)组成一个小乐队在俱乐部同台演出能得到演出费1000元,若歌手和钢琴家一起演出能得800元。而只有钢琴家和鼓手一起演出能得到650元
文档评论(0)