- 0
- 0
- 约6.83千字
- 约 4页
- 2026-03-12 发布于北京
- 举报
多项式期望性质对于最大多矩阵博弈
HowardDai
DepartmentofComputerScience
YaleUniversity
NewHaven,CT06511
howard.dai@yale.edu
2025年8月7日
本
译ABSTRACT
中我们解答了Papadimitriou和Roughgarden提出的一个公开问题[1],关于在一种变体的多矩
2阵博弈中相关均衡的可计算性,其中每个玩家的效用是其边收益的最大值。我们证明了这种
v最大值变种游戏具有多项式期望性质,因此可以应用[1]的结果。我们提出了将这些发现扩
3
4展到其他变体的多矩阵博弈的想法,并简要讨论了在计算相关均衡时对多项式期望性质的需
3求这一更广泛的问题。
1
0
.
61背景
0
5
2我们的工作围绕着[1]的发现展开,该发现表明能够高效计算玩家效用的期望值是能够高效计算相关均衡的
:一个充分条件。为了更好地理解我们的工作,我们在以下小节中简要介绍了定义和这篇论文的主要发现。
v
i
x
r1.1简洁博弈
a
为了保持一致,我们在[1]中使用相同的符号。特别地,一个简洁博弈由高效可识别的输入、
表示类型的多项式时间算法以及计算效用的多项式时间算法组成。特别地,给定输入,返回
,分别对应玩家的数量和每个玩家策略集的基数。如果和max在上是多项式有
界的,那么该游戏属于多项式类型。返回效用玩家接收给定策略。
1.2相关均衡
一种相关均衡是一个分布在策略剖面集合上,条件是对于每个玩家和策略,玩家没有动机切换到
不同的策略。特别是,这可以写成:
这些条件可以写成一个线性规划问题,每种玩家的选择和两种策略对应一行(大约行),使得当且仅当
存在相关均衡时,该线性规划是无界的。如[1]所示,在不可行的对偶上运行椭球算法(“逆境中的椭球”)允
许将程序的解(从而得到一个相关均衡)表示为在每一步由个别被违反约束生成的多项式数量的产品分布的
凸组合。
该过程中的所有步骤都可以在多项式时间内计算,除了一个:约束矩阵与包含产品分布的矩阵相乘,这需要
计算大小为的内积。每个内积展开后可以表示为两个期望效用之差;因此,如果可以在多项式时间内计
算玩家的期望效用,则该乘积也可以在多项式时间内计算。这就是论文主要结果的来源:能够计算期望效用
足以在多项式时间内构造一个相关均衡。
1.3多项式期望性质
一个简洁的游戏具有多项式期望属性,如果存在一个多项式时间算法,该算法在给定一个产品分布
时,返回玩家的预期效用在此分布下:
请注意最幼稚的算法
您可能关注的文档
最近下载
- 中国成人局灶性癫痫规范化诊治指南.docx VIP
- 标准图集-12J609防火门窗图集.pdf VIP
- 临时用电施工方案.doc
- 深度解析(2026)《GBT 3091-2025低压流体输送用焊接钢管 (2026年)深度解析.pptx VIP
- 侍茄师初级专项能力职业技能专业能力考试试卷有答案.docx
- 换届五年工作报告2.doc VIP
- 2024-2025学年江苏省东海县第二中学高考化学试题原创模拟卷(六)含解析.doc VIP
- 嵌入式技术入门与实战(基于STM32)全套教学课件.pptx
- 中国可持续发展战略.pptx VIP
- 基于多模态融合的高中议论文写作内容可视化呈现研究课题报告教学研究课题报告.docx
原创力文档

文档评论(0)