微分博弈理论论述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论 汇报人:张甲乐 什么是博弈论 博弈论亦称对策论,运筹学的一个分支。是研究有利害冲突的双方在竞争性活动中,如何制胜对方的最优策略的数学理论和方法。 博弈论的发展史 博弈论的基本要素 构博弈论由三个基本要素成: 局中人(如竞争的双方); 策略(每个局中人可供选择的行动方案; 一局对策的得失。 博弈论的基本模型 博弈论最基本的模型是两人、零和对策。 每一个局中人,不管他选择什么方案,另一局中人总希望使对方损失最大化,也就是每个局中人将选择使另一局中人把对方损失最大化的企图最小化的策略,这就是博弈论的最佳策略准则。 纳什均衡点 纳什平衡,又称为非合作赛局平衡,是博弈论的一个重要概念,以约翰·纳什命名。如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点。 经典案例:囚徒困境 经典案例:囚徒困境 两人同时陷入招供还是不招供的两难处境。 但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供, 这种情况就称为纳氏均衡点。 这时,个体的理性利益选择是与整体的理性利益选择不一致的。 鞍点(Saddle point) 在微分方程中,沿着某一方向是稳定的,另一条方向是不稳定的奇点,叫做鞍点。 在泛函中,既不是极大值点也不是极小值点的临界点,叫做鞍点。 在矩阵中,一个数在所在行中是最大值,在所在列中是最小值,则被称为鞍点。 在物理上要广泛一些,指在一个方向是极大值,另一个方向是极小值的点。 鞍点问题 在证券市场上,股民们总想“在最小风险下获得最大收益”。生产着总想“在最小投入下获得最大产出”,都是这一辨证思想的体现。将这一思想用数学模型表述,己不再是单纯的极大或极小问题,而是“极大中的极小”或“极小中的极大”。 在数学中,把函数上具有上述“极大一极小”性质的点称为鞍点(Sadd了lePoint)。把同鞍点有关的数学问题称为鞍点问题。 鞍点的含义 下面用二元函数z=f(x,y)来说明鞍点的含义:  对于二元函数z=f(x,y),(x*,y*)为其上一点。若 在邻域|x-x*|£,|y-y*|£内 恒成立。则称(x*,y*)为函数z=f(x,y)的鞍点。 鞍点具有这样的特征:当x=x*为常数,y变化时,函数f(x,y)在(x*,y*)取极小值:当y=y*为常数,x变化时,函数f(x,y)在(x*,y *)取极大值。 鞍点规划(Saddle Point Programming) 鞍点具有特殊的性质,无论是理论上还是实践上,有许多问题与鞍点有关。于是一种与鞍点对应的数学规划就产生并发展起来,称为鞍点规划。 所谓鞍点规划就是以寻求目标函数的鞍点为目的的一种数学规划,用以解决“极大值的极小化”或“极小值的极大化”问题。 鞍点规划的数学模型 鞍点规划的数学模型: 上述鞍点规划模型中,决策变量x,y没有加任何限制。实际上,x,y经常受到一定的约束,于是有以下约束鞍点规划问题: 工程应用实例:防侧翻控制器设计 它给出了一种基于微分博弈理论和进化遗传算法的防侧翻控制器设计方法。 将防侧翻问题描述为一个非合作,零和,二人微分博弈模型。 分别把驾驶员转向角输入和主动防侧倾杆视为扰动方和控制方。 微分博弈模型 方程(1)和(2)分别为汽车系统的状态方程和博弈的目标函数。上述方程中U(控制方)试图使L最小,而W(扰动方)试图使L最大。 方程(3)将这一微分博弈描述成最小最大值优化问题。 L被设为在一个给定的仿真周期中,汽车侧翻角绝对值的最大值,如方程(4)所示。 纳什均衡解 分析可得存在纳什均衡解(u*,w*),使得鞍点不等式(5): 成立 纳什均衡解的含义是在最坏扰动W*(试图使L最大)工况下,最好的控制器输入是U*(试图使L最小);反之亦然。 纳什均衡解 其均衡解是通过进化遗传算法得到的,对进化遗传算法的适应性估计是在汽车仿真软件Carsim上进行的。 数值仿真及结论 通过分析伯德图和在Carsim中的仿真结果,证明它设计的控制器保证了在最坏的转向角输入工况下最坏防侧翻性能,同时分别通过抵抗路面扰动以及侧向加速度,提供了良好的乘坐质量以及防侧翻性能。 《战国策》 《孙子兵法》 《博弈论和经济行为》 《博弈·动态规划和计算机》 微分对策理论 古代产生了朴素的博弈论的思想 1944年美国的J·冯诺意曼和O·摩根司坦发表了巨著 美国的数学家贝尔曼于1951年又发表了名著 1965年埃萨克提出了在追踪问题中双方都能自由决策行动的微分对策理论 发展中 一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即

文档评论(0)

花仙子 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档