- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
运筹学 CH8对策论基础
Chapter8 对策论基础(game theory) Chapter8 对策论基础(game theory) 对策论 对策论,又称:博弈论(game theory) 是研究具有竞争或斗争现象的数学理论和方法;它既是现代数学的分支,也是运筹学中的一个重要分支。 注意: ① 博弈论就是研究两个或多个竞争者之间利益有冲突时,各竞争者应如何分析各方的局势, 权衡利弊,以决定自己应采取怎样的行动,得到一个对己方最有利结局的数学理论。 ② 博弈论的研究非常强调个人理性。 博弈论的背景知识 博弈论发展的历史并不长,但由于它研究的问题与政治、经济、军事活动乃至一般的日常生活等有着密切联系,并且处理问题的方法具有明显特色,所以日益引起广泛注意。 在日常生活中,经常会看到一些相互具有斗争或竞争性质的行为,如下棋、打牌、体育比赛等。 博弈论的背景知识 还比如战争活动中的双方,都力图选取对自己有利的策略,千方百计去战胜对手。 在政治方面,国际间的谈判,各种政治力量之间的斗争,各国际集团之间的斗争等无一不具有斗争的性质。 在经济活动中,各国之间、各公司企业之间的经济谈判,企业之间为争夺市场而进行的竞争等,举不胜举。 博弈论的背景知识 在竞争过程的各方为了达到自己的目标和利益,必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利可最为合理的方案,也就是说要研究采取对抗其他竞争者的策略,这就是对策问题。 对策就是决策者在竞争场合下作出的决策。 博弈论的背景知识 1944年冯·诺依曼(J .von Neumann) 和摩根斯坦(O.Morgenstern)出版了《博弈论与经济行为》 (《Theory of Games and Economic Behavior》),可以说该书是博弈论的奠基之作, 它第一次给对策(game)以明确的数学描述,对有关理论作出了系统的论证, 并且讨论了对策在经济学上的一些应用.这也标志着博弈论成为数学和运筹学的一个分支。 博弈论的背景知识 从1944年到现在,博弈论在理论和应用方面都有了极大的发展。 在理论方面,从最初的零和二人对策(zero-sum two-person game)发展到非零和n人对策(non-zero-sum n-person game), 特别是最近10多年来, 在n人合作对策 (n-person cooperative game)方面的研究有很大的进展 博弈论的背景知识 在应用方面从最初的经济学领域扩展到军事、政治、社会学、心理学等方面, 近年来又有回到经济学方面的趋势. 应强调指出的是,博弈论在经济学中的应用最为广泛也是最成功的.1994年诺贝尔经济学奖同时授给三位博奕论专家纳什 (Nash),泽尔腾 (selten)和海萨尼(Harsanyi),就是一最好的例证。但这种研究目前主要还是定性的研究。 博弈论的背景知识 博弈论的背景知识 博弈论的基本概念 对策模型(或称 对策):具有对策行为的模型。 局中人(Player):在对策行为中,有权决定自己行动方案的对策参加者,称为局中人。 局中人的数目可以多个; 局中人的“人”可以是个人,也可以是某个集体,如球队、企业、公司等,也可是大自然。 局中人都是“理智的”决策者,总是“最大化自己利益”。 博弈论的基本概念 策略(strategy ):在一次对策行为中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。 策略集(strategy set):所有策略构成局中人的策略集。 局势:在二人对策行为中,参与对策的所有局中人各自选取一个策略后(形成策略组),即可构成这次对策行为的一个局势,或结局。当局势出现后,对策行为的结果也就确定。 博弈论的基本概念 支付矩阵(payoff matrix):(支付函数、赢得函数) 在二人对策行为中,所有局势的结果可构成一个矩阵,称之为支付矩阵或赢得函数、支付函数。 二人对策也称为矩阵对策。因为利用对策的支付矩阵能够完成确定对策。 对策问题的三要素: 局中人、策略集、支付矩阵。三要素一旦确定,一个对策模型也就确定了。 博弈论问题举例 A. W. Tucker的囚徒困境(Prisoner‘s Dilemma): 在西方某国, 一次严重的纵火案发生后, 警方抓到两个犯罪嫌疑人 (事实上正是他们为了报复,一起放火烧了这个仓库),但又缺乏足够的证据证明.于是,警方把他们隔离起来,要求坦白交代. 如果他们都承认纵火,每人将入狱五年;如果他们都不坦白, 由于证据不足, 每人将只入狱一年 ; 如果一个抵赖而另一个坦白并且愿意作证, 那么抵赖者将入狱十年,而坦白者将得到释放
文档评论(0)