- 8
- 0
- 约6.14千字
- 约 20页
- 2017-05-20 发布于浙江
- 举报
第十一讲与博弈模型
第十一讲 对策模型 11.1 二人零和对策模型 11.2 进攻与撤退的选择 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 二人零和对策 问题一: 甲、乙两名儿童玩“石头—剪子—布”的游戏。石头胜剪子,剪子胜布,布胜石头。那么,甲、乙儿童如何做,使自己获胜的可能最大? 问题分析:问题中所涉及的要素 (1)游戏决定者—甲、乙儿童两人; (3)游戏的收益(支付)--胜得分为 1,负得分为-1,平得分为 0 。 (2)游戏者的决定—石头、剪子、布; Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 对策行为的三要素 1﹒局中人 在一个对策行为中,有权决定自己行动方案的对策参加者,称为局中人。通常用I表示局中人的集合。如果n个局中人,则I={1,2,…,n}。它可以是一个人,也可以是一个集团或一个自然现象。 2﹒策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案,称为一个策略。设i为局中人,i的所有策略构成的集合Si称为i的策略集。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 3﹒赢得函数(支付函数) 局势: 在一局对策中,各局中人所选定的策略形成的策略组称为一个局势。即若设si是第i个局中人的一个策略,则n个局中人的策略组s={s1, s2,…, sn}就是一个局势。 全体局势的集合S可用各局中人策略集的笛卡尔乘积表示,即S=S1× S2×… × Sn 赢得函数:当局势出现后,对策的结果也就确定了。也就是说,对任一局势s∈S,局中人i可以得到一个赢得Hi(s)。 显然, Hi(s)是局势s的函数,称之为第i局中人的赢得函数。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 二人零和对策的数学模型 1﹒二人有限零和对策: 是指有两个参加对策的局中人,每个局中人都只有有限个策略可供选择,在任一局势下,两个局中人的赢得之和总等于零。 2﹒二人零和对策模型(矩阵对策模型) 设Ⅰ﹑Ⅱ分别表示两个局中人,且它们的纯策略集分别为S1={α1,α2, …,αm}和S2={ β 1, β 2, …, β n}。记局中人Ⅰ对任一纯局势( αi, β j )的赢得值为aij,并称 a11 a12 …a1n . . … . am1 am2 …amn A= 为局中人Ⅰ的赢得矩阵。 局中人Ⅱ的赢得矩阵为﹣A。 通常,将矩阵对策记成G={Ⅰ,Ⅱ;S1 , S2;A}或G={S1 , S2;A} 。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 3﹒局中人如何选取对自己最有利的纯策略? ①局中人的“理智行为” 双方都不想冒险,都不存在侥幸心理,而是考虑到对方必然会设法使自己的所得最小,从各自可能出现的最不利的情形中选择一种最为有利的情形作为决策的依据。 ②选择原则 局中人Ⅰ按最大最小原则,局中人Ⅱ按最小最大原则。即局中人Ⅰ从所有最小的赢得中选择最大的赢得的策略,局中人Ⅱ从所有最大的损失中选择最小的损失的策略。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 例 设有一矩阵G={S1 , S2;A},其中S1={α
原创力文档

文档评论(0)