网站大量收购独家精品文档,联系QQ:2885784924

运筹学 涤脍六讲对策论 .ppt

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
运筹学 涤脍六讲对策论

对策论 game theory   对策论 Game Theory   运筹学 Operations Research (1) 1713年,瓦德格拉夫提出两人对策的经典模型; 对策论历史简介: (2) 古诺和博特兰分别在1838年与1883年提出对策论最经典的模型; (4) 1944年,冯·诺依曼和摩根斯坦合著出版《博弈论与经济行为》一书,被 看作是对策论真正发展的起点; (3) 中国古代的“齐王赛马”; (5) 1994年,瑞典皇家科学院决定将诺贝尔经济学奖授予纳什、哈萨尼和泽 尔腾三人,表彰他们在博弈理论和应用方面作出的杰出贡献; (6) 目前,博弈论在定价、招投标、谈判、拍卖、委托—代理以及很多的经营 决策中得到应用,它已成为现代经济学的重要基础。现代对策论总体上是一门 新兴的发展中的学科。 Nash对对策论的贡献有: (i) 合作对策中的讨价还价模型,称为Nash讨价还价解; (ii) 非合作对策的均衡分析。 -1,-1 -10, 0 0, -10 -5,-5 囚徒1 囚徒 2 坦 白 不 坦 白 坦白 不坦白 (囚徒的困境) 引例 警察抓住两个合伙犯罪的嫌疑犯,但缺乏足够的证据指证他们的罪刑,若其中一个供认犯罪,就能确认罪名成立。为得到所需的口供,警察将两嫌疑犯分开关押并给他们同样的选择机会,若两人都拒不认罪,则他们会以较轻的妨碍公务罪各判一年徒刑;若有一人坦白认罪,则坦白者立即释放,而另一个人则判10年徒刑,若两人同时认罪,则他们各被判5年徒刑,现两个嫌疑犯该如何采取各自的策略(坦白、不坦白)对自己有利? 这是一个二人非零和对策问题,可用一个矩阵来表示两囚徒的得益,如下表所示: 对策论(game theory)亦称博弈论: 是研究具有对抗或竞争性质现象的数学理论和方法,它既是数学的一个分支,也是运筹学的一个重要学科。 对策论概述 引言 对策行为: 是指具有竞争或对抗性质的行为,在这类行为中,参加斗争或竞争的各方各自具有不同的利益和目标,各方需考虑对手的各种可能的行动方案,并力图选择对自己最为有利或最为合理的方案 。 对策:是一些个人、对组或其它组织,面对一定的环境条件,在一定的规则下,同时或先后从各自允许的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及 如何找到这个合理方案的数学理论和方法。是研究决策主体的行为发生直接 相互作用时的决策及这种决策的均衡问题。即它是研究聪明而又理智的决策 者在冲突或合作中的策略选择理论。它将成为当代经济管理学科的前沿领城。 一个对策需要3个基本要素: (1)局中人(players) (2)策略集(strategies) (3)得益函数(payoffs) 对策三要素 引言 策略集: 在一局对策中,可供局中人选择的一个实际可行的完整的行动方案 称为一个策略,所有行动方案的集合成为策略集。每个局中人i 都有自己的 策略集,每一局中人的策略集中至少包含两个策略。 全体局势的集合S可用各局中人的策略集的迪卡尔集表示, 即 局中人:在一个决策行为中,有权决定自己行动方案的对策参加者,常用I 表示局中人的集合。一般要求一个对策中至少要有两个局中人。 是一个局势。 得益函数(也称赢得函数):在一局对策中,对应于各参与方每一组可能的决策选择,都应有一个结果表示该策略组合下每个参与方的得益,常用得益函数表示。若一个策略中有n个参与方,则他们可形成一个策略组 对策的结构和分类 引言 纳什均衡 Nash Equilibrium 对于对策中的每一个局中人,真正成功的措施应该是针对于其他局中 人所采取的每次行动,相应地采取有利于自己地反应策略,于是每一 个局中人应采取的必定是他对其他局中人策略的预测的最佳反应。 【定义 】 在对策G={S1,S2…,Sn;h1,h2…hn}中,如果由各个对策方的各选取一个策略组成的某个策略组合(S1*,S2*…,Sn*)中,任一对策方i 的策略Si*,都是对其余策略方策略的组合 (S1*,…,S*i-1,S*i+1…,Sn*)的最佳策略,即h i(S1*, … , S*i-1, Si*, S*i+1,…Sn*)≥hi(S1*, …, S*i-1, Sij, S*i+1 , …, Sn*)对任意 Sij∈Si 都成立,则称(S1*,…,Sn*)为G的一个纯策略意义下的“纳什均衡”(Nash Equilibrium). 用G 表示一个对策,若一个对策中有 n 个局中人,

文档评论(0)

ctuorn0371 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档