微分对策的具体应用.docVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
微分对策的具体应用

微分对策的具体应用 对策这一概念有许多推广,微分对策是其中之一,而且出现较早,发展也较成熟。微分对策是局中人在每一时刻t皆要做出一个决定的连续情况,例如追逃问题。追和逃的每时每刻皆要做出某种选择。设在时刻t,对局的状态变量(例如,位置、方向、速度等)为x(t)=(x1(t),x2(t),……,xn(t))。设在此时,局中人甲选取的策略(方向速度等)为y=(y1,y2,……,yp),其中yi=yi(t),一般可设ai=yi=bi,ai,bi是常数;局中人乙选取的策略z=(z1,z2,……,zq)也满足类似的关系。y,z称为控制变量(策略),他们按照微分方程组dxi/dt=fi(x;y;z) (i=1,2,……,n)来控制状态变量的运动。当状态主变量达到某一给定的闭集时对局即告结束。 寻求最优的y,z是微分对策的基本课题之一。下面看一道运用微分对策的题目。 Velociraptor,是生活在距今约七千五百万年前的一种食肉恐龙。古生物学家认为这是一种非常顽强地猎食其它动物的野兽,而且可能是成对或成群地外出追猎。然而,不幸的是,无法像观察现代哺乳食肉动物在野外是如何追猎其食物的行为那样,观察到Velociraptor在野外的追猎行为。一组古生物学家来到你们队请求你们在Velociraptor的追猎行为的建模方面给予帮助,他们希望把你们的结果和研究狮子、老虎及其它类似的食肉动物行为的生物学家的研究报告相比较。 成年的Velociraptor平均长三米,髋高0.5米,体重约为45千克。据估计,这种动物跑得非常快。速度可达六十千米每小时,持续时间约十五秒。在一开始的突然加速后,它要停下来并在其肌肉中积聚乳酸以恢复体力。 假设Velociraptor捕食一种称为Thescelosaurus的大小,与Velociraptor差不多的双足食草动物。从Velociraptor化石的生物力学分析得知Velociraptor可以五十千米每小时的速度长时间奔跑。 假设Velociraptor是一只独居的猎食其它动物的野兽,试设计单个的Velociraptor潜近猎物并追猎一只单个的Thescelosaurus策略以及被追捕物逃避追捕的策略的数学模型。假设当Velociraptor潜近到Thescelosaurus的十五米范围内时,Thescelosaurus总能觉察到,根据栖息地及气候条件的不同,甚至在(多达五十米的)更大的范围内觉察欲捕食它的动物的存在。此外,由于Velociraptor的身体结构及体能,它在全速奔跑时的拐弯半径是受到限制的。据估计,拐弯半径大约是其髋高的三倍。另一方面,Thescelosaurus却是极其灵活的,其拐弯半径只有0.5米。 更现实地假设Velociraptor成对外出追猎,试设计一个新的关于成对的Velociraptor潜近猎物并追猎一只单个的Thescelosaurus的策略以及被追捕物逃避追捕的策略的数学模型。利用前面给出的假设和限制。 下面我们用对策数论语表示这一问题的数学陈述。 捕食者和被捕食者之间的拦截和逃避的竞争属于线性微分对策的广泛而形式不同的范筹。在追捕者和逃跑者的微分对策中,两个或多个局中人在遵从对它们的运动的某些限制下试图极大化或极小化它们之间的距离。 和经典的对策论不同,微分对策必须包括微分方程方法的应用以及利用定义局中人的状态和目标的连续的波动。 在传统的或者微分的对策中,局中人试图在一组可供选择的策略中挑选策略使得称为支付函数的值极大化,其中每个局中人的支付是由所有局中人的选择的某个函数确定的。在零和对策情形,所有局中人互相都处于直接竞争的地位使得由他们的支付函数表示的目标正好符号相反。追逃对策属于这个分类;追逐者试图使自己和逃跑者之间的距离极小,而逃跑者却试图使这个距离极大。在Velociraptor——Thescelosaurusp 这样的追逐对策的情形,支付函数是一个简单的二元函数:仅有的有关的结果就是抓住或者逃走。相对于度对策,这种对策称为类对策,度对策的支付可以在更大的可能值上取值。在有些情形,把类对策嵌入到度对策中,同时,把抓住时间(或者逃跑者的分离时间)作为支付函数可能是有用的。尽管在纯粹确定性的试验中这不是必要的,但是一对特定的策略对的平均抓住时间可能提供了一个策略的功效的有用的统计度量。 在微分对策中有两类变量:状态变量,它规定了任意给定时刻整个系统的完全的结构,还有控制变量,对策的参与者用它以有利于极大化它们自己的支付函数的方式来改变状态函数。在惯用的追逃对策中通常的状态变量是参与者的空间坐标;控制变量可以包括最大旋转角或者加速度向量。 所有局中人都可存取在任意给定点和时刻处的状态变量的一个完全集的对策称为完全信息对策;若不是这样的对策称为非完全信息对策。非完全信息对策缺少精

文档评论(0)

hhuiws1482 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档