2026年大学博弈论期末考试200道含答案【轻巧夺冠】.docxVIP

下载本文档

0
0
约7.3万字
约 105页
2026-02-03 发布于山东
举报

2026年大学博弈论期末考试200道含答案【轻巧夺冠】.docx

2026年大学博弈论期末考试200道

第一部分单选题(200题)

1、贝叶斯纳什均衡的核心是？

A.参与者在给定自身信息下的最优策略组合

B.所有参与者策略互为最优反应

C.通过信号传递达成的均衡

D.子博弈完美的均衡路径

【答案】：A

解析：本题考察贝叶斯纳什均衡定义。贝叶斯纳什均衡（BNE）是不完全信息静态博弈的均衡，核心是：每个参与者根据自身信息（类型）选择策略，使期望收益最大化，且策略组合是对对方策略的最优反应。

B为纳什均衡（完全信息），C为信号传递（动态），D为子博弈完美（动态），均不符，选A。

2、在猜硬币游戏中，参与者1策略为“正面（H）”或“反面（T）”，参与者2策略为“猜正面（G）”或“猜反面（F）”。支付规则：若1出H且2猜G，1得1，2得1；1出H且2猜F，1得-1，2得-1；1出T且2猜G，1得-1，2得-1；1出T且2猜F，1得1，2得1。该博弈的混合策略纳什均衡中，参与者1选择H的概率是？

A.0%

B.50%

C.75%

D.100%

【答案】：B

解析：本题考察混合策略纳什均衡。猜硬币无纯策略纳什均衡，需用混合策略。设1以概率p选H，1-p选T；2以概率q选G，1-q选F。参与者1的期望收益：若2选G，1得p*1+(1-p)*(-1)=2p-1；若2选F，1得p*(-1)+(1-p)*1=1-2p。混合均衡时，2对G和F无差异，即2p-1=1-2p→p=0.5。同理参与者2的q=0.5。因此参与者1选H的概率为50%，选项B正确。选项A、D为纯策略，C非均衡概率，错误。

3、在不完全信息古诺模型中，若企业i的成本函数是私人信息，其他企业对其成本有先验信念，则该模型的均衡类型是？

A.纯策略纳什均衡

B.贝叶斯纳什均衡

C.子博弈完美纳什均衡

D.混合策略纳什均衡

【答案】：B

解析：本题考察不完全信息博弈的均衡类型。不完全信息下，参与者的类型（如成本参数）为私人信息，需通过贝叶斯法则更新信念。贝叶斯纳什均衡（BNE）允许参与者在不确定信息下选择策略，且策略需满足给定信念下的最优性。纯策略纳什均衡假设信息完全；子博弈完美适用于完美信息动态博弈；混合策略适用于策略不确定性，未涉及信念更新。

4、在无限次重复的囚徒困境博弈中，参与者为实现合作（双方均选择沉默），最可能采用的策略是？

A.以牙还牙策略（Tit-for-Tat）

B.一次性背叛策略

C.随机终止合作策略

D.固定选择沉默策略

【答案】：A

解析：本题考察重复博弈的合作机制。无限次重复博弈中，“以牙还牙”策略（初始合作，对方背叛则永久背叛）能通过惩罚机制维持合作：若对方短期背叛（如选择坦白），后续合作收益将因惩罚大幅降低，从而约束参与者偏离合作。B选项“一次性背叛”会破坏合作；C选项“随机终止”无法形成稳定的合作预期；D选项“固定沉默”在对方偏离时无约束，无法维持合作。因此正确答案为A。

5、不完全信息求职博弈中，企业为高薪（概率0.6）或低薪（0.4），求职者申请期望收益6，不申请0，贝叶斯均衡策略是？

A.无论企业类型都申请

B.仅高薪时申请

C.仅低薪时申请

D.不申请

【答案】：A

解析：本题考察贝叶斯纳什均衡。求职者无法观察企业类型，只能基于先验概率计算期望收益：

-申请期望收益：0.6*10+0.4*0=60（不申请收益）。

-贝叶斯均衡要求求职者选择期望收益最高的策略，即“申请”。其他选项中，B、C需区分企业类型（不可观察），D收益更低。正确答案为A。

6、在囚徒困境博弈中，每个参与者的占优策略是？

A.保持沉默

B.坦白

C.只有对方沉默时才保持沉默

D.只有对方坦白时才保持沉默

【答案】：B

解析：本题考察占优策略的概念。囚徒困境中，无论对方是否坦白，参与者选择“坦白”的刑期均更短（如：若对方沉默，坦白判0年优于沉默判1年；若对方坦白，坦白判8年优于沉默判10年），因此“坦白”是占优策略。选项A错误，沉默不满足占优策略条件；选项C和D错误，占优策略与对方行为无关，仅取决于自身收益。

7、在以下哪种博弈中，参与人需要使用混合策略才能达到纳什均衡？

A.猜硬币游戏（一方猜正，一方猜反，猜中赢）

B.囚徒困境

C.智猪博弈

D.斯塔克伯格模型（序贯博弈）

【答案】：A

解析：混合策略纳什均衡用于无纯策略均衡的博弈。A猜硬币游戏中，参与人1若选‘正面’，参与人2必选‘反面’；若选‘反面’，参与人2必选‘正面’，无纯策略均衡，需以一定概率随机选择（混合策略）。B、C存在纯策略纳什均衡（囚徒困境：背叛；智猪博弈：大猪按，小猪等）；D斯塔克伯格模型是序贯博弈，用逆向归纳法求子博弈完美均衡，无需混合策略。故A正确。

2026年大学博弈论期末考试200道含答案【轻巧夺冠】.docxVIP

2026年大学博弈论期末考试200道含答案【轻巧夺冠】.docx

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档