博弈论(本科).docVIP

下载本文档

18
0
约4.45千字
约 11页
2018-05-06 发布于河南
举报
版权申诉

博弈论(本科).doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈论(本科)

博弈论第一节、基本概念定义：是描述和研究行为者之间策略相互依存和相互作用的决策理论。基本类型：静态与动态完全信息与不完全信息基本要素：参与者；策略；支付矩阵；顺序；概率。第二节、基本的博弈策略一、占优策略（静态、完全信息）无论其他参与者采取什么策略，某参与者唯一的最优策略。注意：不论是同时选择，还是先后选择，均衡结果是相同的。不常见。二、纳什均衡：如果给定其他参与者的最优策略，某参与者的最优策略。 1、单一的纳什均衡（静态、完全信息）海滩定位博弈（动态、完全信息） 2、两个纳什均衡（动态、完全信息） 3、经典模型与应用智猪博弈：大股东与小股东；大户与散户；大企业与小企业等。斗鸡博弈（两个纳什均衡）：抢占市场；夫妻矛盾；两军对垒等。三、最大最小策略：最大化最小所得的策略。（静态、不完全信息）保守，而非利润最大化。对对手的“完全理性”或“完全信息”缺乏信心。对手的错误选择将给自己造成严重后果。案例：两厂商决策是否研发新产品，厂商1目前具有竞争优势。投资博弈万美元厂商2 不投资投资厂商1 不投资 0，0 -10，10 投资 -100，0 20，10 厂商1的最大化最小策略。厂商1如何最大化预期收益： 1无法确定2是否投资，但知道2不投资的可能性只有10%，1是否投资？投资的预期收益：0.1×（-100）+0.9×20 = 8 不投资的预期收益：0.1×0+0.9×（-10）= -9 1应该投资。如果1认为2不投资的可能性是30%，1是否投资？投资的预期收益：0.3×（-100）+0.7×20 = -16 不投资的预期收益：0.3×0+0.7×（-10）= -7 1不应该投资。四、混合策略（动态、不完全信息）纯策略：参与者有一确定的最优策略。混合策略：不存在确定的最优策略，参与者根据各种结果出现的概率，以一定的概率随机选择各种策略。零和博弈每个人都想猜透对方的策略，而又不想让对方猜透自己的策略。社会福利博弈流浪汉找工作游荡政府救济 3， 2 -1， 3 不救济 -1， 1 0， 0 政府想救济流浪汉，但前提是你要找工作，但又不能区分每个流浪汉是否在找工作，因此只能统一对待。流浪汉只有在政府不救济时才会找工作。政府的最优策略：政府不可以选择救济或不救济的纯策略，因为流浪汉相应的策略使政府的效用降低。政府应以某一概率选择救济(p)或不救济(1-p)，使流浪汉找工作和游荡的预期效用相同。 p×2+(1-p)×1 = p×3+(1-p)×0 p=0.5 当政府救济与否的概率都是0.5时（混合策略），则流浪汉找工作的预期效用：0.5×2+0.5×1=1.5；游荡的预期效用：0.5×3+0.5×0=1.5；流浪汉找工作或游荡（纯策略），或者以任何概率选择找工作和游荡（混合策略）的预期效用都一样。这是政府的最优策略。因为，如果救济的概率大于不救济的概率，流浪汉游荡的预期效用大于找工作的预期效用，流浪汉会选择游荡（纯策略），政府也就要选择不救济（纯策略），流浪汉又找工作，政府又救济……，不能达成市场均衡。反之亦然。流浪汉的最优策略：流浪汉不可以选择找工作或游荡的纯策略，这会使政府选择相应的救济或不救济的纯策略使流浪汉的效用降低。流浪汉应以某一概率选择工作（r）或游荡（1-r）,使政府救济和不救济的预期效用相同。 r×3+(1-r)×(-1)=r×(-1)+(1-r)×0 r=0.2 当流浪汉找工作的概率是0.2，游荡的概率是0.8时，则政府救济的预期效用：0.2×3+0.8×（-1）= -0.2；不救济的预期效用：0.2×（-1）+ 0.8×0 = -0.2；政府救济或不救济（纯策略），或者以任何概率选择救济和不救济（混合策略）的预期效用都一样。这是流浪汉的最优策略。因为，如果找工作的概率大于0.2，政府救济的预期效用会大于不救济，政府会选择救济（纯策略），流浪汉又会游荡，政府又不救济……，不能形成均衡。反之亦然。（3）纳什均衡：政府与流浪汉博弈的最终结果是：政府以0.5的概率选择救济，以0.5的概率选择不救济；流浪汉以0.2的概率选择找工作，以0.8的概率选择游荡。如果最初的策略组合不是这样，博弈的最终结果应该如此。例如，政府救济的概率最初是0.2，则流浪汉找工作的预期效用：0.2×2+0.8×1=1.2；游荡的预期效用：0.2×3+0.8×0=0.6；流浪汉找工作的预期效用大于游荡的预期效用，流浪汉是否一定找工作呢？流浪汉如果一定找工作，则政府就会救济，