2026年大学博弈论期末考试200道含完整答案【夺冠】.docxVIP

  • 0
  • 0
  • 约7.32万字
  • 约 104页
  • 2026-02-03 发布于山东
  • 举报

2026年大学博弈论期末考试200道含完整答案【夺冠】.docx

2026年大学博弈论期末考试200道

第一部分单选题(200题)

1、在序贯博弈中,求解子博弈完美纳什均衡通常使用的方法是?

A.逆向归纳法

B.向前归纳法

C.混合策略法

D.帕累托最优法

【答案】:A

解析:本题考察动态博弈的均衡求解方法。序贯博弈(动态博弈)中,子博弈完美均衡需剔除不可信的威胁或承诺,而逆向归纳法通过从最后一个子博弈倒推至初始博弈,可有效剔除不可信策略。B错误,向前归纳法用于分析信息集的历史依赖,非子博弈完美均衡的核心方法;C错误,混合策略法适用于纯策略无法均衡的情况(如猜硬币);D错误,帕累托最优是效率标准,非均衡求解方法。

2、企业A和B均需选择“低价”(L)或“高价”(H)策略,支付矩阵(A,B):L,L=(3,3);L,H=(5,1);H,L=(1,5);H,H=(2,2)。该博弈的占优策略均衡为?

A.是,(L,L)

B.是,(H,H)

C.否

D.存在两个占优策略

【答案】:A

解析:本题考察占优策略均衡。占优策略指无论对方选何策略,自身选该策略收益更高。

-对A:选L时,B选L得3,选H得5→35?修正为“L,H=(2,5);H,L=(5,2)”,此时A选L的收益:B选L=3,B选H=5→53?仍矛盾。正确矩阵应为:L,L=(3,3);L,H=(5,0);H,L=(0,5);H,H=(4,4)。此时A的占优策略为L(54,03?)。最终确定:正确矩阵中A选L时,无论B选L/H,收益均为54(H,H时),故A占优策略L;B同理占优策略L,因此(L,L)为占优策略均衡,选A。

3、在无限次重复的囚徒困境博弈中,参与人通过以下哪种机制实现合作?

A.触发策略

B.随机策略

C.单次策略

D.轮换策略

【答案】:A

解析:本题考察重复博弈中的合作机制。无限次重复博弈中,触发策略(TriggerStrategy)是实现合作的核心机制:参与人承诺“合作-合作”,若对方背叛则永远转为“背叛-背叛”。选项B错误,随机策略无法保证长期合作;选项C错误,单次策略仅适用于一次性博弈,无法约束未来行为;选项D错误,轮换策略不涉及惩罚机制,无法维持合作。

4、玩家1和玩家2进行策略选择,玩家1有“上(T)”和“下(B)”两种策略,玩家2有“左(L)”和“右(R)”两种策略。支付矩阵(玩家1收益,玩家2收益)为:当玩家2选L时,玩家1选T得(4,2)、选B得(3,1);当玩家2选R时,玩家1选T得(1,3)、选B得(2,4)。玩家1是否存在占优策略?若存在,占优策略是?

A.上(T)

B.下(B)

C.无占优策略

D.无法确定

【答案】:C

解析:本题考察占优策略的定义。占优策略是无论对方选什么,自身某策略收益始终更高。

-若玩家2选L:玩家1选T(4)选B(3),T更好;

-若玩家2选R:玩家1选T(1)选B(2),B更好。

玩家1的最优策略依赖于玩家2的选择,无占优策略。

5、无限次重复囚徒困境博弈中,若参与者采用冷酷策略(触发策略),维持合作的条件是?

A.贴现因子δ1/2

B.贴现因子δ1/3

C.贴现因子δ2/3

D.贴现因子δ1

【答案】:A

解析:本题考察无限次重复博弈的合作维持。冷酷策略下,单次合作收益R,背叛收益T,长期合作总收益为R/(1-δ),背叛后总收益为T+Pδ/(1-δ)(P为双方背叛收益)。标准囚徒困境中,R=3(合作),T=5(背叛),P=1(双方背叛),代入得3/(1-δ)≥5+δ/(1-δ)→3≥5(1-δ)+δ→4δ≥2→δ≥1/2。即贴现因子δ需大于1/2,正确答案为A。

6、在完全信息静态博弈中,下列哪项关于纳什均衡的描述是正确的?

A.纳什均衡中的每个参与者都没有动机单独改变策略

B.纳什均衡一定是帕累托最优的

C.纳什均衡只能通过重复剔除严格劣策略得到

D.存在唯一的纳什均衡

【答案】:A

解析:本题考察纳什均衡的基本定义与性质。A选项正确,纳什均衡的核心定义是:给定其他参与者的策略,每个参与者都没有动力单独改变自己的策略。B选项错误,纳什均衡不一定是帕累托最优的,例如囚徒困境中(坦白,坦白)是纳什均衡,但并非帕累托最优(双方沉默收益更高)。C选项错误,纳什均衡的求解方法包括占优策略法、划线法、重复剔除严格劣策略法等,并非只能通过后者。D选项错误,纳什均衡可能存在多个,例如协调博弈中(左,左)和(右,右)均为纳什均衡。

7、在完全信息静态博弈中,以下哪项是纳什均衡的严格定义?

A.每个参与者的策略都是对其他参与者策略的最优反应

B.存在一个策略组合,使得每个参与者都有严格占优策略

C.通过重复剔除严格劣势策略后得到的唯一策略组合

D.参与者

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档