多项式期望性质对于最大多矩阵博弈.pdfVIP

下载本文档

0
0
约6.83千字
约 4页
2026-03-12 发布于北京
举报

多项式期望性质对于最大多矩阵博弈.pdf

多项式期望性质对于最大多矩阵博弈

HowardDai

DepartmentofComputerScience

YaleUniversity

NewHaven,CT06511

howard.dai@yale.edu

2025年8月7日

本

译ABSTRACT

中我们解答了Papadimitriou和Roughgarden提出的一个公开问题[1]，关于在一种变体的多矩

2阵博弈中相关均衡的可计算性，其中每个玩家的效用是其边收益的最大值。我们证明了这种

v最大值变种游戏具有多项式期望性质，因此可以应用[1]的结果。我们提出了将这些发现扩

4展到其他变体的多矩阵博弈的想法，并简要讨论了在计算相关均衡时对多项式期望性质的需

3求这一更广泛的问题。

61背景

2我们的工作围绕着[1]的发现展开，该发现表明能够高效计算玩家效用的期望值是能够高效计算相关均衡的

:一个充分条件。为了更好地理解我们的工作，我们在以下小节中简要介绍了定义和这篇论文的主要发现。

r1.1简洁博弈

为了保持一致，我们在[1]中使用相同的符号。特别地，一个简洁博弈由高效可识别的输入、

表示类型的多项式时间算法以及计算效用的多项式时间算法组成。特别地，给定输入，返回

，分别对应玩家的数量和每个玩家策略集的基数。如果和max在上是多项式有

界的，那么该游戏属于多项式类型。返回效用玩家接收给定策略。

1.2相关均衡

一种相关均衡是一个分布在策略剖面集合上，条件是对于每个玩家和策略，玩家没有动机切换到

不同的策略。特别是，这可以写成：

这些条件可以写成一个线性规划问题，每种玩家的选择和两种策略对应一行（大约行），使得当且仅当

存在相关均衡时，该线性规划是无界的。如[1]所示，在不可行的对偶上运行椭球算法（“逆境中的椭球”）允

许将程序的解（从而得到一个相关均衡）表示为在每一步由个别被违反约束生成的多项式数量的产品分布的

凸组合。

该过程中的所有步骤都可以在多项式时间内计算，除了一个：约束矩阵与包含产品分布的矩阵相乘，这需要

计算大小为的内积。每个内积展开后可以表示为两个期望效用之差；因此，如果可以在多项式时间内计

算玩家的期望效用，则该乘积也可以在多项式时间内计算。这就是论文主要结果的来源：能够计算期望效用

足以在多项式时间内构造一个相关均衡。

1.3多项式期望性质

一个简洁的游戏具有多项式期望属性，如果存在一个多项式时间算法，该算法在给定一个产品分布

时，返回玩家的预期效用在此分布下：

请注意最幼稚的算法

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

多项式期望性质对于最大多矩阵博弈.pdfVIP