- 1、本文档共214页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人民大学博弈论课件
第 2 讲 博弈的规则 博弈论 所有的博弈都有四个要素 参与人 行动 支付 信息 这四点总称为“博弈规则”。我们对于博弈论的研究就是根据博弈规则描述博弈环境,解释在这个环境中将会发生什么 博弈论 为了最大化他的支付,参与人会根据每一时刻的信息集选择行动,从而形成计划,即策略。 参与人的策略组合被称为均衡。 给定均衡,我们就可以看到参与人的具体行动是什么,从而决定博弈的结果。 博弈论 为了考虑清楚这些基本概念,我们引入一个例子。假设一个企业家正在考虑是否开设一个新的干洗店,在这之前已经有了一个干洗店。我们把这两个企业称为“新清洁者”和“老清洁者”。新清洁者担心经济是否会进入衰退,同时不知道老清洁者对于他的进入是采用价格战还是保持高定价不变。 参与人 博弈中的每一个决策者称为 参与人 可以是个人, 厂商, 一个国家 每一个参与人可以在一系列可能的行动中选择 参与人的个人特征没有影响 没有 “好孩子” 或者 “坏孩子” 参与人 有时候可以考虑伪参与人。伪参与人的行动完全是机械式的。 自然是一个伪参与人,在博弈的某一时刻按照给定概率采取随机行动。 例如在我们上面的例子中,自然以0.3的概率选择衰退,0.7的概率选择繁荣。 行动 参与人i的行动,记做ai,是他所能进行的选择。 参与人i的行动集Ai={ ai }是所有可行行动的集合。 行动组合是n个参与人行动列表a= { ai }, (i=1,…,n)。 在我们的例子中,新清洁者的行动是{进入,保持不动},老清洁者的行动是{低价格,高价格} 支付 博弈结束时候对于参与人的最终支付称为 支付 也可以表示为期望效用 支付通常利用效用衡量 也使用货币支付 假设参与人可以对于一个博弈的支付排序 博弈论 信息集,就是参与人认为可能的随机变量的值。如果包含很多元素,说明参与人没有办法区分。 博弈论 可以将信息集和行动构成游戏顺序(order of play)。 考虑我们的例子 新清洁者选择进入决策,行动集{进入,保持不动} 老清洁者选择价格{低,高} 自然选择需求。 博弈论 策略si表示了一个规则,这个规则表示在每一个信息集上选择哪个行动。 策略是对于所有可能环境(信息集)的,虽然可能有些参与人不希望达到。这种完备性导致了策略是不可观测的。 参与人的策略集或者策略空间是所有可行策略的集合Si={ si } 策略组合是所有参与人策略的列表s={s1,…,sn } 博弈论 为了预测博弈的结果,我们需要考虑可能的策略组合。但是策略组合不是结果。后者是我们感兴趣变量的实现值。不同的策略组合可能导致相同的结果。我们的例子中可能是行动也可能是支付。 均衡s*={s*1,…,s*n }是一个策略组合,每个参与人都选择了最好的策略。 博弈论中的均衡与经济学其他领域的均衡并不完全相同。我们必须区分均衡和均衡结果。 博弈论 我们必须决定,什么叫做“最好”的策略。 我们必须定义均衡概念。这表示F: {S1, … , Sn,π1, … , πn } →s*,即一个规则,根据可能的策略组合和支付函数定义一个均衡。 博弈论可能存在多均衡。 记号 两个参与人 (A 和 B)之间的博弈G记做 G[SA,SB,UA(a,b),UB(a,b)] 其中 SA = 参与人A 的可行策略(a ? SA) SB = 参与人B的可行策略(b ? SB) UA = 参与人 A 采取某个策略获得的效用 UB = 参与人 B 采取某个策略获得的效用 博弈论 第3讲 完全信息静态博弈 博弈规则 参与人 行动 支付 信息 知道对手的支付,但是不知道对手的行动 博弈的标准型表示 例如双变量矩阵 求解博弈 策略 策略与行动不可区分 均衡概念 占优策略 重复剔除严格劣策略 纳什均衡 占优策略 在讨论均衡概念的时候,可以简写“所有其他参与人的策略” 对于任何向量y=(y1,…,yn),利用表示y-i向量(y1,…,yi-1, yi+1,…,yn)。 参与人i对于所有其他参与人选择的策略s-i的最优反应是策略s*i,这个策略可以为他带来最大的支付;也就是: 占优策略 如果没有其他的策略一样好,那么最优反应是强最优,否则是弱最优。 第一个重要的均衡概念基于占优这个思想。 策略sdi是一个被占优策略,如果这个策略严格劣于其他某个策略,而不论其他参与人选择什么策略。从数学上看, sdi被占优,如果存在一个策略s’i满足: 占优策略 有的时候某个策略可以击败所有的其他策略,这种策略称为“占优策略” 策略s*i是一个占优策略,如果其对于其他参与人能够挑选的所有策略都是最优反应。从数学上来看: 占优策略 一个占优策略均衡是一个策略组合,包含了每一个参与人的占优策略。 占优均衡 因为(招认,招认)是一个占优均衡,信息结构都不发生作用。 例如,两人先后行动也是这
您可能关注的文档
- 中国联通XXX分公司2011年2013年光进铜退发展规划模板.doc
- 中国联通WLAN接入选择与工程界面.pdf
- 中国联通XX省分公司GSM网络优化服务实施方案.doc
- 中国联通nodeb维护操作手册.pdf
- 中国联通全国干线网传输设备简明维护手册.doc
- 中国美容时尚报·时尚版20100524.pdf
- 中国联通传输工程光缆线路施工规范2011年修订版.doc
- 中国联通安徽2008年GSM网室内覆盖工程可研报告.doc
- 中国联通XX电子渠道系统硬件验收文档.pdf
- 中国联通宁夏WCDMA网室内覆盖工程曲江生态大酒店覆盖设计方案.doc
- 2025年广西中考地理二轮复习:专题四+人地协调观+课件.pptx
- 2025年广西中考地理二轮复习:专题三+综合思维+课件.pptx
- 2025年中考地理一轮教材梳理:第4讲+天气与气候.pptx
- 第5讲+世界的居民课件+2025年中考地理一轮教材梳理(商务星球版).pptx
- 冀教版一年级上册数学精品教学课件 第1单元 熟悉的数与加减法 1.1.6 认识1-9 第6课时 合与分.ppt
- 2025年中考一轮道德与法治复习课件:坚持宪法至上.pptx
- 2025年河北省中考一轮道德与法治复习课件:崇尚法治精神.pptx
- 八年级下册第二单元+理解权利义务+课件-2025年吉林省中考道德与法治一轮复习.pptx
- 精品解析:湖南省娄底市2019-2020学年八年级(上)期中考试物理试题(原卷版).doc
- 2025年中考地理一轮教材梳理:第10讲+中国的疆域与人口.pptx
最近下载
- AP统计学 2018年真题 (选择题+问答题) AP Statistics 2018 Real Exam and Answers (MCQ+FRQ).pdf
- 110kV变电站的接地网络设计.doc
- 试析《聊斋志异》中的花妖.doc
- 2025年许昌电气职业学院单招职业适应性测试题库(含答案).docx VIP
- 周遂林-四川省优秀毕业生评选答辩.ppt VIP
- 社区老年人养生健康指引.pptx VIP
- 年产100吨头孢拉定原料药车间工艺设计.docx
- 2025年许昌电气职业学院单招职业适应性测试题库含答案.docx VIP
- 外语慕课中国工艺与工匠精神(上海应用技术大学)课后作业期末测试答案.docx
- 产品语义学PPT课件.ppt VIP
文档评论(0)