- 12
- 0
- 约1.53万字
- 约 68页
- 2019-10-24 发布于湖北
- 举报
§1 对策论的例子§2 矩阵对策论的基本概念§3 矩阵对策的最优纯策略§4 矩阵对策的混合策略§5 其他类型的对策 对策论或博弈论(Game Theory) 是研究具有对抗和竞争性行为问题的数学理论与方法。是运筹学的重要分支学科 经济学领域一般称博弈论,是经济学领域近几十年发展起来一门新兴学科 对策问题举例 例1 猜单和猜双的博弈。两个人同时出一个指头或两个指头,如果两人出的指头相同,则局中人1从局中人2处赢得五元;如果出的不一样,局中人1就要支付给局中人2五元。两个对手都可以采取两个策略:出一个手指和出两个手指,下表是局中人1的赢得矩阵(二指莫拉问题) 例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。警察告诉他们:如果两人都坦白,各判刑8年;如果两人都抵赖,由于证据不充分,两人将各判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯都有两种策略:坦白或抵赖。可以用一个矩阵表示两个嫌疑犯的策略的损益 例3 田忌与齐王赛马 “齐王赛马”齐王在各局势中的益损值表(单位:千金) §1 对策论的基本概念 对策模型的三个基本要素: 1.局中人(Players):参与对抗的各方; 2.策略集(Strategices):局中人选择对付其它局中人的行动方案称为策略;某局中人的所有可能策略全体称为策略集 3.一局势对策的益损值:局中人各自使用一个对策就形成了一个局势,一个局势决定了各局中人的对策结果(量化)称为该局势对策的益损值。 赢得函数(payoff function):定义在局势上,取值为相应益损值的函数 4. 纳什均衡:纳什均衡指所有局中人最优策略组成的一种局势,既在给定其他局中人策略的情况下,没有任何局中人有积极性去选择其他策略 对策的分类 对策 二人有限零和对策(又称矩阵对策): 局中人为2;每个局中人的策略集的策略数目都是有限的;每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。 通常将矩阵对策记为: G = {S1, S2, A} 局中人甲的策略集: 局中人乙的策略集: 甲的赢得矩阵: 其中:齐王的策略集: S1={ ?1, ?2, ?3, ?4, ?5, ?6 }, 田忌的策略集: S2={ ?1, ?2, ?3, ?4, ?5, ?6 }。 下面矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3 在如此反复对策的过程中,各局中人如果不想冒险,就应该考虑从自身可能出现的最坏情况下着眼,去选择一种尽可能好的结果,即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。这就是所谓“理智行为”。称为最小最大准则,按照这个各方均避免冒险的观念,就形成如下的推演过程。 矩阵A中每行的最小元素分别为1,-3,-5。 在这些最少赢得中最好的结果是1,故局中人Ⅰ会采取策略?1,无论对手采取何策略,局中人Ⅰ至少得1分。对于局中人Ⅱ,{?1,?2,?3}可能带来的最少赢得,即A中每列的最大元素,分别为6,1,4。局中人Ⅱ会采取?2策略,确保局中人Ⅰ不会超过1分。 ?1和?2分别称为局中人Ⅰ、 Ⅱ的最优策略。由于双方必然选择这一种策略,所以,这种策略又称为最优纯策略。 矩阵对策有解的条件 现在,讨论矩阵对策在纯策略意义下有解的充分必要条件。 证明 必要性 设G在纯策略意义下有解,即成立 但是否每个矩阵对策一定存在鞍点呢?回答是否定的。现在考察下例。 例7 掷硬币投注的对策 两个局中人之间开展有裁判的掷硬币游戏,无论出现正面还是反面,裁判将结果告诉局中人甲,局中人甲看完结果后,有两种选择:(1)放弃投注并支付给局中人乙5美元。如果局中人甲放弃,游戏就结束了。但如果局中人甲投注(bet on),游戏继续,这时局中人乙也有两种选择: (1)放弃投注并支付5美元给局中人甲; (2)跟着下注。如果局中人乙选择下注,裁判将投币结果展示给乙看,如果是正面,局中人乙支付10美元给局中人甲;如果是反面,则局中人甲支付给局中人乙10美元。 (1)试写出对策中各局中人的策略集 (2)建立局中人甲的赢得矩阵 (3)判断对策是否存在鞍点 (4)求解此矩阵对策 解(1)分析对策双方可能采取的策略情况,投币的情况有两种可能,甲
您可能关注的文档
- 第六章生物与环境4.ppt
- 第六章生物氧化中职.ppt
- 第六章灌溉水源与取水方式.ppt
- 第六章生物群落的组成、结构和生态演.ppt
- 第六章生物机械原理.ppt
- 第六章社会化和个体化.ppt
- 第六章生物碱64酪氨酸来源.ppt
- 第六章第三节旅游者其他个别要求的处理.ppt
- 第六章第3节神经调节的基本方式.ppt
- 第六章第3节神经调节的基本方式2.ppt
- (正式版)DB33∕T 2574-2023 《 数字乡村建设规范 》.pdf
- (正式版)DB33∕T 2554-2022 《“GM2D”进口商品数据元 》.pdf
- (正式版)DB33∕T 2573-2023 《 助残护理员照护服务规范 》.pdf
- (正式版)DB33∕T 2542-2022 《餐饮计量规范 》.pdf
- (正式版)DB33∕T 2558.1-2022 《林下套种菌药生产技术规程 第1部分:大球盖菇》.pdf
- (正式版)DB33∕T 2558.3-2022 《林下套种菌药生产技术规程 第3部分:羊肚菌 》.pdf
- (正式版)DB33∕T 2575-2023 《 野生猛禽和涉禽安全救护技术规程 》.pdf
- (正式版)DB33∕T 2544-2022 《森林人家建设规范》.pdf
- (正式版)DB33∕T 310010-2021 《沿海防护林生态效益监测与评估技术规程》.pdf
- (正式版)DB33∕T 3004.1-2015 《农村厕所建设和服务规范 第1部分:农村改厕管理规范 》.pdf
原创力文档

文档评论(0)