第讲博弈论解说.ppt

下载文档 降价啦

3
0
约5.62千字
约 66页
2016-06-25 发布于湖北
举报
版权申诉
保障服务

第讲博弈论解说.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

* 课程主要内容完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 * 完全信息静态博弈概念概念：各参与人对彼此的策略集、支付函数有准确了解博弈行为同时进行一些实例石头、剪子、布游戏彼此了解的两个厂商的价格战 * 完全信息静态博弈概念有些实际博弈虽然决策不是在绝对时间意义上的“同时”，但决策的时间先后差别跟博弈结果没有关系，也可看成是“同时进行的博弈”。如不同竞标单位作出的工程投标决策 * 博弈的策略式表述常用G表示一个博弈博弈模型的两种表示形式策略式表述 (Strategic form), 扩展式表述（Extensive form）本章主要介绍博弈的策略式表述 * 博弈的策略式表述参与人集合 N人博弈的参与人集合，往往也记为N。参与人则记为i, i∈ N 参与人i的策略集，记为Si ,其中的一个特定策略，可记为si.有si ∈ Si. * 对于给定的参与人i, i=1,2,…N, 卡氏积 S1×S2 … ×Si-1 × Si+1 …× Sn 表示除了参与人i外所有参与人所有策略的可能组合，通常记为S-i；于是所有参与人不同策略组合构成的策略空间可表示为 S=(Si , S-i) 博弈的策略式表述 * Si中的元素 si 表示参与人i的一个具体策略一旦确定了所有参与人的策略，便形成了一个博弈局势，表示为s=(s1, s2, … sN)，s∈S。博弈的策略式表述 * 参与人i的效用函数参与人 i的支付函数，是从博弈局势集 S=S1×S2 …× SN 到实数集R的一个映射，记为 ui(s1, s2, … s N)，表示参与人i对局势s = (s1, s2, … sn)的偏好。一个博弈可以表示为 G = {S1, … ,SN; u1, … ,uN, i ∈N} 这就是博弈的策略式表述博弈的策略式表述 * 博弈的策略式表述例写出囚徒问题的策略式表述参与人集合N={囚徒1，囚徒2} 参与人的策略集S1=S2= {坦白，不坦白} 各参与人的支付，可用图1-1表示。坦白不坦白坦白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-1 囚徒问题的支付矩阵囚徒1 囚徒2 * 博弈的策略式表述实质上，图1-1已经完全表述了囚徒困境的策略式表述信息称图1-1为二人有限博弈的双矩阵 (bimatrix)表述坦白不坦白坦白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-1 囚徒问题的支付矩阵囚徒1 囚徒2 * 占优均衡英文术语：Dominant-strategy Equilibrium 定义：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。 * 占优策略对于所有的s-i， si*称为参与人i的严格占优战略，如果满足： ui(si*,s-i)ui(si,s-i) ? s-i, ? si ?si* * 占优均衡占优均衡定义一个博弈的某个策略组合中，如果对应的所有策略都是各参与人的占优策略，则称该策略组合为该博弈的一个占优均衡。 * 占优均衡占优战略均衡：每个参与人的占优战略组合(如果存在的话)被称为占优战略均衡。坦白不坦白坦白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-2 囚徒问题的支付矩阵囚徒1 囚徒2 * 占优均衡以囚徒1为例，无论囚徒2采取什么策略… 坦白不坦白坦白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-2 囚徒问题的支付矩阵囚徒1 囚徒2 * 占优均衡坦白总是占优策略图1-2 囚徒问题的支付矩阵囚徒1 囚徒2 坦白不坦白坦白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) * 占优均衡由于矩阵的对称性，对囚徒2来说亦可得出类似结论坦白不坦白坦白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) 图1-2 囚徒问题的支付矩阵囚徒1 囚徒2 * 占优均衡因此，该博弈的策略组合(坦白、坦白)是占优均衡。图1-2 囚徒问题的支付矩阵囚徒1 囚徒2 坦白不坦白坦白 (-8, -8) (0, -10) 不坦白 (-10, 0) (-1, -1) * 上一讲内容回顾博弈论用处（解释、预测和提出