2博弈论概述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2博弈论概述.ppt

第2章 博弈论概述 2.1 博弈论的概念 2.2 博弈讨论的前提 2.3博弈研究的价值 2.4 博弈的要素 2.5 博弈的类型 2.1 博弈论的概念 博:丰富多彩;弈:下棋、打牌等对抗性游戏。 博弈:丰富多彩的对抗性游戏 博弈——相关利益各方在竞争的情况下,通过行动、策略等的实施最终达到某种收益的过程。 博弈论(Game Theory) 研究相关利益各方参与的情况下,如何决策以最大化自身收益,并最终达到一种均衡状态的理论。 2.2 博弈讨论的前提 理性-经济人假设 相关利益假设 各参与者的策略具有相互依存性 信息是不完全,不对称的 理性(rational) 理性包括三项内容: (1)存在一组可供选择的备选或替代方案; (2)每一种方案均对应着某种特定的预期净收益或满足程度或目标实现程度; (3)人们总是选择那个能够带来最大预期净收益的方案。 (西蒙,1964) 相关利益人 受到一项决策影响的群体或个人 2.3博弈研究的价值 可用资源有限,相关利益方利益的冲突是一种必然; 在解决利益冲突过程中,人们是理性的,即以利已为目的,不以损人为目的。理性并最大化自己的收益,是社会资源配置的一种有效方式,但并不总是如此,收益具有相互依存性; 信息完全、信息对称只是一种理想状态; 博弈模型是社会各种各样博弈过程的简化模型,一个博弈模型能反映一类博弈问题的实质。 2.4 博弈的要素 (1)参与者(player) 参与者:博弈中的决策主体,又称局中人。目的是通过合理选择自己的行动,以最大化自己的收益(或效用)。 如,囚徒困境中的囚徒甲、乙; 情侣博弈中的男孩、女孩 等。 自然:不以博弈各方的意志为转移的外生事件,用概率分布来描述自然的选择机理。 如:对于两个竞争对手来说,市场需求的大小 (2)信息(information) 信息:参与者在博弈过程中能了解和观察到的知识。包括“自然”的选择,其他参与者的特征和行动等。是参与者决策的依据 公共知识(common knowledge):所有参与者知道,所有参与者知道所有参与者知道,所有参与者知道所有参与者知道所有参与者知道……”的知识。 完全信息:每一个参与者对自己及其他参与者的行动及各参与者选择行动组织产生的收益等知识有完全的了解。 完美信息:处于某个决策结的参与者在选择行动前,能够获取从初始结到这个决策结的路径上所有参与者行动的信息。 信息对称:在竞争中,参与者A知道参与者B掌握的信息,B也知道A掌握的信息。 (3)行动(action) 行动:参与者可选的行动方案。 如:囚徒困境中的囚徒可以“坦白”,也可以“抵赖”。 行动的相互依存(interdependence)性:每个参与者的行动选择都受到其他参与者的影响。 (4)策略(strategy) 策略:参与者应对其他参与者的行动作出反应的规则。与博弈的先后有关。 纯策略:指参与者在博弈中可以选择采用的行动方案,是参与人在给定信息结构的情况下的行动规则,它规定参与人在什么时候的什么情况下采取什么行动。因而一个策略是参与人的一个“相机行动方案” 。如:“人不犯我,我不犯人;人若犯我,我必犯人” 混合策略:参与者的混合策略是他的纯策略空间上的一种概率分布,表示参与人实际进行决策时根据这种概率分布在纯策略中随机选择加以实施。 (5)收益(payoffs) 收益:一个特定的策略组合下各参与者得到的确定的效用或期望效用。指博弈结果的输赢、得失、盈亏等。 一个参与者的收益不仅取决于自己的行动,而且取决于其他参与者的行动。 (6)均衡(equilibrium) 均衡:任一参与者单方面改变行动都不能获得更多收益的行动组合及收益组合。 如:囚徒困境中的(坦白,坦白) 2.5 博弈的类型 合作与非合作博弈 根据博弈参与各方能否达成一个具有约束力的协议,博弈分为合作博弈和非合作博弈。 合作博弈着眼于团体理性,注意效率、公平和公正。 非合作博弈关注于个人理性、个人最优决策。 静态博弈与动态博弈 根据参与者行动的先后顺序,博弈可以分为静态博弈和动态博弈。 静态博弈:博弈中,参与者同时选择行动或者虽非同时行动但后行者并不知道前行者采取了什么行动 动态博弈:参与者的行动有先后顺序,后行者能够观察到先行者所选择的行动。 完全信息与不完全信息博弈 根据参与者对博弈的环境(包括自然、其他参与者的特征、偏好和策略)是否有全面而准确的知识(信息),博弈可分为完全信息博弈和不完全信息博弈。 完全信息博弈:每个参与者对其他参与者的特征、策略及收益函数有全面而准确的知识。 不完全信息博弈:参与者对博弈的环境没有完备的信息。 重复博弈与一次博弈 博弈次数为一的称为一次博弈;否则称为重复博弈。 有限重复博弈与无限重复博弈 如果博弈的重复次数是有限的,称为有限重复博弈;如果重复博弈没

文档评论(0)

cai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档