博弈论-sugoocom.ppt

下载文档 降价啦

10
0
约6.26千字
约 33页
2017-08-15 发布于天津
举报
版权申诉
保障服务

博弈论-sugoocom.ppt

1、本文档共33页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

博弈论-sugoocom

第2章策略型博弈策略型博弈案例:艺术品拍卖的策略型占优策略解案例研究续：拍卖中的占优策略策略型博弈博弈的策略型由三项内容所确定：? 1.?博弈中局中人的名单. 2.?每个局中人可使用的策略集. 3. 与任何策略组合（每个局中人一个策略）相对应的盈利. 盈利是冯?诺依曼-摩根斯坦效用。最简单的博弈类型是两个局中人有两个策略的博弈。策略型 : 局中人2 北南局中人1 高 π1 , π2 π1 , π2 (高,北), (高,北) (高,南),(高,南) 低 π1 , π2 π1 , π2 (高,北), (高,北) (高,南), (高,南) 当局中人多于两个，以及每个局中人有两个以上的策略时，对策略型的三个分量使用下述符号：局中人将标记为1，2，…，N。一个局中人代表将表示为第i个局中人。局中人i的策略通常表示为si，一个特定的策略表示si*或si#。除了局中人i以外的所有其它局中人的策略选择记为s-i。 πi 将表示局中人i的盈利(或冯?诺依曼-摩根斯坦效用)函数。对于策略组合，s1*，s2*，…，sN*，其中每一个局中人相应于一个策略，局中人i的盈利将表示为πi (s1*，s2*，…，sN*)。囚徒困境（c = 认罪，nc = 拒绝认罪）卡尔文＼克雷 c nc c 0, 0 7, -2 cn -2, 7 5, 5 抛硬币打赌（Matching pennies）( h = 正面, t = 反面) 局中人1＼局中人2 正面反面正面 1，-1 -1，1 反面 -1，1 1，-1 投票对每一个投票者，在这个博弈中的策略有三个部分：在第一轮中如何投票和第二轮中如何投票，而在第二轮中的投票本身有两个分量。第一个分量是，如果议案A在第一阶段通过后在第二轮中投票人如何投票，第二分量是，如果（在第一轮中）议案B通过后，该投票人又将如何投票。特别地，每个投票人有下述8个策略可供选择*。 AAN; AAB; ANB; ANN; BAN; BAB; BNB; BNN; *当然，投票人知道她在第一轮中自己是怎样投票的。原则上，她的策略也可以根据这个信息。目前我们将略去这种复杂性，因为这样的话，每一个策略中分量的个数将增加到5——替代原来的3。（为什么？）与展开型的等价性两种表示博弈的方式是等价的：每一个展开型博弈可以写成策略型且反之亦然。案例：艺术品拍卖的策略型艺术品拍卖：描述假如我们被带入位于纽约洛克菲勒中心的索士比?派克伯尼特的大型拍卖场之一。拍卖商站在房间前面的讲台上。她的旁边有一对随从举着待拍卖物件的影像。设想待拍卖的物件是雷诺伊（Renoir, 1841—1919）的一组绘画；你很想拥有标号为“#264”的那件可爱的咖啡吧景色。你必须开始做如下的事。注册：如果你打算投标，必须在商品展销室的入口处注册。那里你将得到一块写有编号的拍卖牌。（为了注册，恐怕你需要一张信用卡。) 出价程序：一旦轮到标号#264，“你出价所必须做的就是举起你的拍卖牌并等待拍卖商理会你，你不必叫出你出价的数——通常由拍卖商以10%的增量自动确定高一些的出价。你不必坐的毕恭毕敬；抓耳挠腮不能算作为一个出价（除非你与拍卖商事先就做了安排）。如果没有人超过你的出价，就是说，没有其他的拍卖牌举起，那么拍卖商敲下小木槌以结束拍卖。” 艺术品拍卖：策略型局中人：注册的那些人策略：考虑局中人策略的一个简单方法是认定局中人愿意举牌的最高价。结局：最后一个举牌的拍卖者赢得雷诺依作品（抓耳挠腮者不能得到）。盈利：赢者将付多少钱？占优策略解定义. 如果不管其他局中人选择什么样的策略，局中人i的策略s?i的盈利严格地大于他的所有其他策略的盈利，换言之， πi (s?i, s-i) πi (si, s-i) 对一切si和s-i成立其中s-i是除了局中人i以外的其他局中人选择的策略向量。那么我们称策略s?i强优于局中人i的所有其他策略. 考虑局中人1，我们称该局中人的策略b——记作s1b——优于其他策略——s1a，意指针对局中人2的两个策略来说，s1b比s1a 更好一些；于是 π1(s1b , s2a) π1(s1b, s2a) π1(s1b , s2b) π1(s1a , s2b) ? 第一个不等式指出了，如果局中人2采用了他的第一个策略，那么s1b比s1a 产生较高一些的盈利；第二个不等式指出了即使局中人2选择他的第二个策略，同样的事实也成立。定义. 如果局中人i的策略s?i，对于其他局中人的每一个策略来说，至少与他的另一个策略s#i一样地好，而对于其他局中人的某个策略来说，s?i严