- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
对策论一刘志新2003.10.21 主要内容 1.基本概念 2.二人零和有限对策 3.二人非零和有限对策 4.二人零和无限对策 基本概念 1.对策论 2.局中人:决策的主体 3.支付:局中人从对策中获得的利益 4.行动:局中人在某时点上的决策变量 5.战略:局中人的行动规则 6.支付函数 基本概念 7.合作对策非合作对策 8.两人对策多人对策 9.零和对策常和对策变和对策 10.静态对策动态对策重复对策 11.完全信息对策不完全信息对策 一个例子 囚徒困境 研究对策论常用的两种模型 一展开型 二正规型 展开型对策 例: 展开型对策 定义1:有n个局中人的对策树是指具有以下性质的三元组,使得:为树,且为一映射,为局中人的集合为一映射 展开型对策 定义2:设为对策树,称为由 产生的n人对策,对策也称为展开型对策. 定义3:在对策中,设有策略组使对于任何的及均有:,则称为对策的一个平衡点. . 展开型对策 定理:设 为对策树,则 有一个平衡点 正规型对策 定义1:给定三元组其中均为集合,而 是定义在上的实值函数,则称 为一个对策. 定义2:若有策略,使称为甲的保守策略.. 正规型对策 定义3:若有满足:则称策略对为对策的非合作平衡解. 定义4:对于对策对,若不存在策略对,同时有,则称为对策的Pareto最优 二人零和有限对策 策略的表示:矩阵 二人零和有限对策 保守解策略是如下的策略,一般的 二人零和有限对策 我们希望定义:在二人零和有限对策 中,若甲的支付函数为,设有值则称对策 有鞍点,公共值 称为对策的值,相应的策略对为对策的鞍点. 二人零和有限对策 有些时候鞍点是不存在的.例: 混合策略 引入混合策略 记 考虑期望收益定义:对于, 若有策略对满足,其中,则称为 的鞍点. 混合对策的存在性定理 定理:设都是紧的,且上连续,对于,有 方法1:用凸集分离定理方法2:用Kakutani不动点原理方法3:优策略 定义:对于值为 而支付函数为的对策,凡使的策略称为甲的优策略.而使的策略 称为乙的优策略. 优策略的性质 性质1:每个局中人的优策略集是一个凸集. 性质2:若 是乙的优策略,并设则对甲的任何优策略 ,必有:其中表示甲取策略 ,乙取策略时的支付. 优策略的性质 性质3:设 为对策值, 为甲的任何优策略,有若对某个 ,有则对乙的任何优策略 必有 性质4:设 为对策值,若对乙的任何优策略 有则甲必有一个优策略 ,使得: 优策略的性质 性质5:若矩阵 可写作分块矩阵若 中的每一列严格超出 中列的凸组合,又设 中的每一行严格的被 中行的某个凸组合超出,则 , , 均可删去而不影响甲乙的优策略集. 优策略的计算 定理:设对策值为 , 支付矩阵为 的对策其优策略为端点优策略的充要条件是存在 的子方阵 ,使得:式中表示 的伴随矩阵. 优策略的计算 例:可取可得: 二人一般和有限对策 双矩阵对策: 定义:在对策中,若有策略对,使得:则称为 的一个非合作平衡点 存在性定理 定理:对每个双矩阵对策至少存在一个非合作平衡点.对作改进: 判断平衡点为平衡点 平衡点的Lemke_Howson算法 定理:当对策为非退化时,对策肯定存在平衡点.矩阵A非退化是指:每个方子阵都是非奇异的除去最后的零矩阵 平衡点的Lemke_Howson算法 例:选取 谈判问题 可行集 谈判的基点各自的保守收益 谈判的结果找,使得双方都满意即存在映射 ,使得. Nash的谈判公理体系 公理1个体合理性: 公理2可行性: 公理3Pareto最优性若且则. 公理4无关方案的独立性:若,且,则.Nash的谈判公理体系 公理5线性变换的无关性设T是由S经如下线性变换而得到的,如果则必有其中为正常数,为常数. 公理6对称性 :若S是对称的,即若有,且若,则有. 谈判定理 定理:对于所有的谈判问题,存在唯一的满足以上公理的. “恐吓”问题 考虑以下的双矩阵对策:都有独立的恐吓策略,谈判的基点: 二人零和无限对策 问题的描述: 定义:在二人零和无限对策中,若存在使得对所有都成立 ,则称为鞍点.在无限对策中,鞍点不一定存在.鞍点 定义:在对策,点称为鞍点,若下式对任意的都成立, 无限对策中的混合扩张 定义: :集合X的子集的代数y:集合Y的子集的代数:,y上所有的概率测度组成的集合称为对策的混合扩张, 其中 混合扩张的平衡点 定义:为二人零和无限对对策,为对策的混合扩张,若存在使得对所有的都有:称为对策的混合扩张的平衡点.具连续支
文档评论(0)