- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第8章 博弈论与竞争策略
第八章 博弈论与竞争策略 第一节 博弈的基本要素与分类 第二节 完全信息静态博弈 第三节 完全信息动态博弈 第四节 不完全信息博弈:静态与动态分析 第一节 博弈的基本要素与分类 一、囚徒困境及博弈的基本要素 二、博弈的基本分类 一 、囚徒困境及博弈的基本要素 博弈论,也称对策论,是描述和研究行为者之间策略相互依存和相互作用的一种决策理论。 囚徒困境(Prisoner’s dilemma)是博弈论中的一个著名案例,它简明地、富于典型意义地勾画了博弈论的基本特征和博弈的基本要素。所以,我们借助于这一案例来展开分析。 图8-1是双方在坦白与抵赖情形之下的收益矩阵。 解:因 坦白均为双方占优均衡战略 均衡结果: NE{(坦白,坦白),(-8,-8)} PE{(抵赖,抵赖),(-1,-1)} 由上可见,虽然对两个囚犯总体而言,最好的结果是都不交代,但 最终的结果是都交代。两囚犯在决策时都以自己的最大利益为目标,结 果却是无法实现最大利益甚至较大利益。囚徒困境反映了个体理性与集 体理性的矛盾。 由囚徒困境的博弈中,可以看出博弈包含如下的基本要素: 1. 参与方,或称博弈方 参与方指参与博弈并承担后果的利益主体。 参与方必须具有理性,以最优策略实现自身利益最大化。 参与方可以是个人,也可以是法人。此外,博弈论还设有一种虚拟 参与人(pseudo-player),即自然状态(nature-state)。 一般参与人以 表示。 2.1策略指的是博弈中的任一参加者针对其他参加者的可能的行为所采 取的行为原则和应对办法。 2.2 一般地,可用 表示第i参与人的一个特定策略。 代表 第i个参与人所有可能选择的策略集合。如果有n个参与人,每个参与人 选择一个特定策略,则n维向量 称为一个策略组合 (strategy profile) 3. 得益或收益 3.1收益是策略组合的函数,指局中人采用特定策略得到的收益,可以 基数效用或预期效用表示。 3.2 表示第i个参与人的最优策略,则所有参与 人的最优策略组合为: 4. 均衡 4.1均衡指博弈的所有参与者从自我利益最大化出发选择的策略所组成 的策略集。 例如,囚徒困境中的均衡是(坦白,坦白)。 二、博弈的基本分类 可分为合作博弈(cooperative game)和非合作博弈 (non-cooperative game):20世纪50年代,对合作博弈的研究达到高峰,此后,对非合作博弈的研究成为博弈论主流。现今研究绝大多数是非合作博弈。 2. 可分为单人博弈、双人博弈和多人博弈:“人”不一定是指自然人,而是指博弈方,指博弈的参加者。 3. 分为有限策略博弈(finite game)和无限策略博弈(infinite game) 4. 分为零和博弈(zero game)、常和博弈(constant-sum game)和变和博弈(variable-sum game) 5. 分为静态博弈(static game)和动态博弈(dynamic game) 6. 分为完全信息博弈(complete information game)和不完全信息博弈(incomplete information game) 根据博弈的信息特征和行为时间特征,可将博弈分为如图8-2所示的内容。 第二节 完全信息静态博弈 一、上策与纳什均衡 二、极大化极小策略 所有参与同时选择策略,且收益函数为公共信息的博弈,称对完全信息静态博弈。这是最简单、也是最基本的博弈形式。若 参与人i 策略组合Si 收益函数Ui 则完全信息静态博弈G可表示为: 一、上策与纳什均衡 1. 上策是指如果不管对方选择何种策略,我选择的策略都是我所能选择的最优策略,可以“不变应万变”,称为上策(dominant strategy)。反之,不管对方选择什么策略,我选择的策略都是我所能选择的最劣策略,比其他策略的收益都低,称为下策(dominanted strategy)。各方上策的组合构成上策均衡(dominant strategy)。 2. 纳什均衡(Nash equilibrium)是指在给定对方竞争对手的选择行为后,博弈方选择了它所能选择的最好的策略(或采取了他所能采取的最好的行动)。纳什均衡可能不止一解。 3. 上策与纳什均衡的关系:上策一定是纳什均衡,但纳什均衡不一定是上策。可以说,上策是纳什均衡的一个特例。 4. 若干实例 [例1]两个广告商在进行是否做广告的博弈时,双方的
您可能关注的文档
最近下载
- (YUM)百胜验厂审核详细要求清单.pdf VIP
- 四上数学口算竖式脱式应用题每日一练60天(60页).pdf VIP
- 《云南彝良地区地质构造特征探讨.docx VIP
- 三上数学口算竖式脱式应用题每日一练60天(60页).pdf VIP
- 2025年新青岛版数学三年级上册全册课件.pptx
- 《旅游客源地与目的地概况》教案 第1课 了解世界旅游业(一).pdf VIP
- 人教版劳动教育四年级上册全册教学设计.pdf VIP
- 2022年国家人体生物监测工作手册.pdf VIP
- 电子课件自主学习修订版第一单元开启自主学习的旅程.pptx VIP
- JBT 4333.2-2013 厢式压滤机和板框压滤机 第2部分:技术条件.pdf VIP
文档评论(0)