惩罚框架下求解广义Nash均衡问题地分解算法.pdfVIP

惩罚框架下求解广义Nash均衡问题地分解算法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
惩罚框架下求解广义Nash均衡问题地分解算法

中国科学:数学 2014年 第44卷 第3期:295—305 《中国科学》杂志社 SCIENCECHINA PRESS 惩罚框架下求解广义 Nash均衡问题的分解算法 卫婴婴①②,徐玲玲①②,韩德仁①② ①南京师范大学数学科学学院 南京 210023; ②江苏省大规模复杂系统数值模拟重点实验室,南京 210023 E—mail:yywei124~126.com,xulingling@njIlUedu.ca,handeren@njnu.edu.cn 收稿 日期:2012-11—29;接受 日期:2013—08—26; 通信作者 国家自然科学基金 (批准号和江苏省高校 自然科学基金 (批准号:13KJD110007)资助项目 摘要 广义Nash均衡 问题 (GNEP),是非合作博弈论中一类重要的问题,它在经济学、管理科学和交 通规划等领域有着广泛的应用.本文主要提出一种新的惩罚算法来求解一般的广义 Nash均衡 问题, 并根据罚函数的特殊结构,采用交替方向法求解子问题.在一定的条件下,本文证明新算法的全局收 敛性.多个数值例子的试验结果表明算法是可行的,并且是有效的. 关键词 广义Nash均衡 问题 内点惩罚方法 变分不等式 可分离结构 交替方向法 MSC (2010)主题分类 65K05,93B40 1 引言 广义 Nash均衡问题,简称 GNEP,是经典 Nash均衡 问题 fNEP)的推广.在这类问题中,每个参 与者的 目标函数和可行集都依赖于其他参与者的策略.GNEP是源于经济学的一类重要模型,最早的 研究可追溯到Debreu[1].早期还称为社会均衡问题、均衡规划和抽象经济问题等.GNEP己广泛应用 于经济学、管理科学和交通规划等许多领域 [,引,然而针对此类 问题的算法的研究还处于初级阶段. 目前,已有的迭代算法有以下几类:第一类方法基于Nikaido—Isodo(NI)函数,通过NI函数可以将 GNEP转化为相关的优化问题来求解 [,51.文献 2【]采用的松弛方法也是基于NI函数的,文献 [6]用 NI函数解决了带有共享 凸约束的一类特殊情形的GNEP.第二类方法基于变分不等式 (VI),文献 7『1 推导出两类与GNEP相关的含参 vI形式,文献 8『,9]指出可通过求解单个的变分不等式来得到GNEP 的解,但是找到的是一类特殊的解,称作正规化均衡.第三种方法基于拟变分不等式,文献 f101利用优 良函数设计算法,研究了带有共享凸约束的一类特殊 问题,文献 f1],121基于拟变分形式给出了投影类 算法求解一般的GNEP. 相 比而言,求解一般的 GNEP 的数值算法 比较稀少,设计有效的算法来求解更一般 的GNEP成 为当前研究的热点.近年来,一些学者提出了利用惩罚技巧来求解 GNEP,Pang和 Fukushima[13]首 次提出了基于惩罚方法来求解 GNEP,Facchinei和 Pang[14]提出了精确罚函数方法框架,其中需要解 不可微的Nash均衡问题.Fukushima[15]提出了受限制的惩罚方法来找到一类特殊解,称为受限均衡. 文献 1『6,17]给出了两种惩罚框架:对所有约束和对部分约束进行惩罚.可以说,惩罚方法为GNEP的 研究开辟了新的路径. 卫婴婴等:惩罚框架下求解广义 Nash均衡问题的分解算法 本文提出新的惩罚框架来定义罚参数的更新准则,从而将 GNEP转化为带有简单约束的经典 Nash均衡 问题,并利用交替方向法这一有效工具来求解子问题.在一定的条件下 我们证 明新算法的 全局收敛性,最后的数值结果进一步说明了新方法的可靠性和有效性. 2 问题描述 假设有 Ⅳ 个参与者,第 11(=l,2… .,Ⅳ)个参与者的决策变量记为 ∈ .我们将所有 参与者的决策变量所组成的向量记为 ,除参与者 之外的所有参与者的决策变量所构成的向量记 为 一,其中, ∈R“,佗:=∑N : 1礼.我们有时也用 (,~)代替 .记第 个参与者的可行策略集 为 Q ”, Q:=nQ ∈Ⅳ 表示所有参与者所构成的可行策略集,

文档评论(0)

shaofang00 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档