2026年大学博弈论期末考试200道含完整答案【夺冠】.docxVIP

下载本文档

0
0
约7.32万字
约 104页
2026-02-03 发布于山东
举报

2026年大学博弈论期末考试200道含完整答案【夺冠】.docx

2026年大学博弈论期末考试200道

第一部分单选题(200题)

1、在序贯博弈中，求解子博弈完美纳什均衡通常使用的方法是？

A.逆向归纳法

B.向前归纳法

C.混合策略法

D.帕累托最优法

【答案】：A

解析：本题考察动态博弈的均衡求解方法。序贯博弈（动态博弈）中，子博弈完美均衡需剔除不可信的威胁或承诺，而逆向归纳法通过从最后一个子博弈倒推至初始博弈，可有效剔除不可信策略。B错误，向前归纳法用于分析信息集的历史依赖，非子博弈完美均衡的核心方法；C错误，混合策略法适用于纯策略无法均衡的情况（如猜硬币）；D错误，帕累托最优是效率标准，非均衡求解方法。

2、企业A和B均需选择“低价”（L）或“高价”（H）策略，支付矩阵（A,B）：L,L=(3,3)；L,H=(5,1)；H,L=(1,5)；H,H=(2,2)。该博弈的占优策略均衡为？

A.是，（L,L）

B.是，（H,H）

C.否

D.存在两个占优策略

【答案】：A

解析：本题考察占优策略均衡。占优策略指无论对方选何策略，自身选该策略收益更高。

-对A：选L时，B选L得3，选H得5→35？修正为“L,H=(2,5)；H,L=(5,2)”，此时A选L的收益：B选L=3，B选H=5→53？仍矛盾。正确矩阵应为：L,L=(3,3)；L,H=(5,0)；H,L=(0,5)；H,H=(4,4)。此时A的占优策略为L（54，03？）。最终确定：正确矩阵中A选L时，无论B选L/H，收益均为54（H,H时），故A占优策略L；B同理占优策略L，因此（L,L）为占优策略均衡，选A。

3、在无限次重复的囚徒困境博弈中，参与人通过以下哪种机制实现合作？

A.触发策略

B.随机策略

C.单次策略

D.轮换策略

【答案】：A

解析：本题考察重复博弈中的合作机制。无限次重复博弈中，触发策略（TriggerStrategy）是实现合作的核心机制：参与人承诺“合作-合作”，若对方背叛则永远转为“背叛-背叛”。选项B错误，随机策略无法保证长期合作；选项C错误，单次策略仅适用于一次性博弈，无法约束未来行为；选项D错误，轮换策略不涉及惩罚机制，无法维持合作。

4、玩家1和玩家2进行策略选择，玩家1有“上（T）”和“下（B）”两种策略，玩家2有“左（L）”和“右（R）”两种策略。支付矩阵（玩家1收益,玩家2收益）为：当玩家2选L时，玩家1选T得(4,2)、选B得(3,1)；当玩家2选R时，玩家1选T得(1,3)、选B得(2,4)。玩家1是否存在占优策略？若存在，占优策略是？

A.上（T）

B.下（B）

C.无占优策略

D.无法确定

【答案】：C

解析：本题考察占优策略的定义。占优策略是无论对方选什么，自身某策略收益始终更高。

-若玩家2选L：玩家1选T（4）选B（3），T更好；

-若玩家2选R：玩家1选T（1）选B（2），B更好。

玩家1的最优策略依赖于玩家2的选择，无占优策略。

5、无限次重复囚徒困境博弈中，若参与者采用冷酷策略（触发策略），维持合作的条件是？

A.贴现因子δ1/2

B.贴现因子δ1/3

C.贴现因子δ2/3

D.贴现因子δ1

【答案】：A

解析：本题考察无限次重复博弈的合作维持。冷酷策略下，单次合作收益R，背叛收益T，长期合作总收益为R/(1-δ)，背叛后总收益为T+Pδ/(1-δ)（P为双方背叛收益）。标准囚徒困境中，R=3（合作），T=5（背叛），P=1（双方背叛），代入得3/(1-δ)≥5+δ/(1-δ)→3≥5(1-δ)+δ→4δ≥2→δ≥1/2。即贴现因子δ需大于1/2，正确答案为A。

6、在完全信息静态博弈中，下列哪项关于纳什均衡的描述是正确的？

A.纳什均衡中的每个参与者都没有动机单独改变策略

B.纳什均衡一定是帕累托最优的

C.纳什均衡只能通过重复剔除严格劣策略得到

D.存在唯一的纳什均衡

【答案】：A

解析：本题考察纳什均衡的基本定义与性质。A选项正确，纳什均衡的核心定义是：给定其他参与者的策略，每个参与者都没有动力单独改变自己的策略。B选项错误，纳什均衡不一定是帕累托最优的，例如囚徒困境中（坦白，坦白）是纳什均衡，但并非帕累托最优（双方沉默收益更高）。C选项错误，纳什均衡的求解方法包括占优策略法、划线法、重复剔除严格劣策略法等，并非只能通过后者。D选项错误，纳什均衡可能存在多个，例如协调博弈中（左，左）和（右，右）均为纳什均衡。

7、在完全信息静态博弈中，以下哪项是纳什均衡的严格定义？

A.每个参与者的策略都是对其他参与者策略的最优反应

B.存在一个策略组合，使得每个参与者都有严格占优策略

C.通过重复剔除严格劣势策略后得到的唯一策略组合

D.参与者

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2026年大学博弈论期末考试200道含完整答案【夺冠】.docxVIP