博弈论-sugoocom.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论-sugoocom

第2章 策略型博弈 策略型博弈 案例:艺术品拍卖的策略型 占优策略解 案例研究续:拍卖中的占优策略 策略型博弈 博弈的策略型由三项内容所确定:? 1.?博弈中局中人的名单. 2.?每个局中人可使用的策略集. 3. 与任何策略组合(每个局中人一个策略)相对应的盈利. 盈利是冯?诺依曼-摩根斯坦效用。最简单的博弈类型是两个局中人有两个策略的博弈。 策略型 : 局中人2 北 南 局中人1 高 π1 , π2 π1 , π2 (高,北), (高,北) (高,南),(高,南) 低 π1 , π2 π1 , π2 (高,北), (高,北) (高,南), (高,南) 当局中人多于两个,以及每个局中人有两个以上的策略时,对策略型的三个分量使用下述符号: 局中人将标记为1,2,…,N。一个局中人代表将表示为第i个局中人。 局中人i的策略通常表示为si,一个特定的策略表示si*或si#。除了局中人i以外的所有其它局中人的策略选择记为s-i。 πi 将表示局中人i的盈利(或冯?诺依曼-摩根斯坦效用)函数。对于策略组合,s1*,s2*,…,sN*,其中每一个局中人相应于一个策略,局中人i的盈利将表示为πi (s1*,s2*,…,sN*)。 囚徒困境 (c = 认罪,nc = 拒绝认罪) 卡尔文\克雷 c nc c 0, 0 7, -2 cn -2, 7 5, 5 抛硬币打赌(Matching pennies) ( h = 正面, t = 反面) 局中人1\局中人2 正面 反面 正面 1,-1 -1,1 反面 -1,1 1,-1 投票 对每一个投票者,在这个博弈中的策略有三个部分:在第一轮中如何投票和第二轮中如何投票,而在第二轮中的投票本身有两个分量。第一个分量是,如果议案A在第一阶段通过后在第二轮中投票人如何投票,第二分量是,如果(在第一轮中)议案B通过后,该投票人又将如何投票。特别地,每个投票人有下述8个策略可供选择*。 AAN; AAB; ANB; ANN; BAN; BAB; BNB; BNN; *当然,投票人知道她在第一轮中自己是怎样投票的。原则上,她的策略也可以根据这个信息。目前我们将略去这种复杂性,因为这样的话,每一个策略中分量的个数将增加到5——替代原来的3。(为什么?) 与展开型的等价性 两种表示博弈的方式是等价的:每一个展开型博弈可以写成策略型且反之亦然。 案例:艺术品拍卖的策略型 艺术品拍卖:描述 假如我们被带入位于纽约洛克菲勒中心的索士比?派克伯尼特的大型拍卖场之一。拍卖商站在房间前面的讲台上。她的旁边有一对随从举着待拍卖物件的影像。设想待拍卖的物件是雷诺伊(Renoir, 1841—1919)的一组绘画;你很想拥有标号为“#264”的那件可爱的咖啡吧景色。你必须开始做如下的事。 注册:如果你打算投标,必须在商品展销室的入口处注册。那里你将得到一块写有编号的拍卖牌。(为了注册,恐怕你需要一张信用卡。) 出价程序:一旦轮到标号#264,“你出价所必须做的就是举起你的拍卖牌并等待拍卖商理会你,你不必叫出你出价的数——通常由拍卖商以10%的增量自动确定高一些的出价。你不必坐的毕恭毕敬;抓耳挠腮不能算作为一个出价(除非你与拍卖商事先就做了安排)。如果没有人超过你的出价,就是说,没有其他的拍卖牌举起,那么拍卖商敲下小木槌以结束拍卖。” 艺术品拍卖:策略型 局中人:注册的那些人 策略:考虑局中人策略的一个简单方法是认定局中人愿意举牌的最高价。 结局:最后一个举牌的拍卖者赢得雷诺依作品(抓耳挠腮者不能得到)。 盈利:赢者将付多少钱? 占优策略解 定义. 如果不管其他局中人选择什么样的策略,局中人i的策略s?i的盈利严格地大于他的所有其他策略的盈利,换言之, πi (s?i, s-i) πi (si, s-i) 对一切si和s-i成立 其中s-i是除了局中人i以外的其他局中人选择的策略向量。那么我们称策略s?i强优于局中人i的所有其他策略. 考虑局中人1,我们称该局中人的策略b——记作s1b——优于其他策略——s1a,意指针对局中人2的两个策略来说,s1b比s1a 更好一些;于是 π1(s1b , s2a) π1(s1b, s2a) π1(s1b , s2b) π1(s1a , s2b) ? 第一个不等式指出了,如果局中人2采用了他的第一个策略,那么s1b比s1a 产生较高一些的盈利;第二个不等式指出了即使局中人2选择他的第二个策略,同样的事实也成立。 定义. 如果局中人i的策略s?i,对于其他局中人的每一个策略来说,至少与他的另一个策略s#i一样地好,而对于其他局中人的某个策略来说,s?i严

文档评论(0)

wangyueyue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档