2026年大学博弈论期末考试200道含答案【研优卷】.docxVIP

  • 0
  • 0
  • 约7.04万字
  • 约 101页
  • 2026-02-03 发布于山东
  • 举报

2026年大学博弈论期末考试200道含答案【研优卷】.docx

2026年大学博弈论期末考试200道

第一部分单选题(200题)

1、在无限次重复的囚徒困境博弈中,参与者能否通过触发策略(冷酷策略)实现合作?

A.不能,因为贴现因子太小

B.能,当贴现因子足够大时

C.能,无论贴现因子多大

D.不能,因为参与者不理性

【答案】:B

解析:本题考察无限次重复博弈中的合作可能性。无限次重复博弈中,贴现因子δ(未来收益现值)足够大时,触发策略(一旦对方偏离则永远不合作)可使合作成为均衡:偏离的短期收益小于长期合作的收益现值。若贴现因子过小,未来收益权重低,合作无法维持。因此正确答案为B。

2、在无限重复的囚徒困境博弈中,参与者采用“以牙还牙”策略的核心目的是?

A.实现合作均衡(双方都不坦白)

B.尽快结束博弈以获取短期利益

C.避免被对方欺骗而遭受损失

D.最大化单次博弈的收益

【答案】:A

解析:本题考察重复博弈的合作机制。“以牙还牙”策略通过“合作-合作,背叛-背叛”的触发机制,诱导对方维持合作(A选项正确)。B选项“尽快结束博弈”是单次博弈的行为,与重复博弈追求长期收益矛盾;C选项“避免被欺骗”是策略的具体形式,而非核心目的;D选项“单次博弈收益最大化”是囚徒困境单次纳什均衡的结果,与重复博弈的合作目标相悖。

3、无限次重复博弈中,若双方采用触发策略(一旦对方背叛则永远进入纳什均衡),能否实现合作?

A.不可能,因为单次背叛收益始终高于合作收益

B.可能,只要贴现因子足够大(δ1/2)

C.可能,当贴现因子δ=1时必然实现合作

D.可能,只要参与者均为风险中性

【答案】:B

解析:本题考察无限次重复博弈的合作可能性。触发策略能否维持合作取决于长期合作收益是否超过短期背叛收益。假设单次合作收益为3,背叛收益为5,贴现因子δ(未来收益的现值系数)。长期合作总收益为3/(1-δ),背叛收益为5+δ*(-3)(背叛后进入纳什均衡收益-3)。当3/(1-δ)5-3δ,即δ1/2时,合作可行。选项A错误,长期合作收益可超过短期背叛;选项C错误,δ=1时贴现因子不影响收益,但题目中未说明单次博弈收益;选项D错误,风险中性非必要条件。正确答案为B。

4、二手车市场中,卖者知车质量(好/坏),买者不知但知‘好车’概率0.6。好车卖者出售收益10,坏车-5;买者买好车收益15,坏车-5。若仅好车提供保修,买者观察保修后购买。该博弈属于?

A.混同均衡

B.分离均衡

C.混合策略均衡

D.贝叶斯均衡

【答案】:B

解析:本题考察不完全信息博弈的均衡类型。分离均衡指不同类型(好/坏车)通过信号(保修)区分,好车提供保修,坏车不提供,买者可据此判断,因此是分离均衡(B正确)。混同均衡指无区分(A错误);混合策略均衡指随机策略(C错误);贝叶斯均衡是通用概念,本题特指分离均衡。

5、序贯博弈中,参与人1先行动选择‘合作’或‘不合作’:若选‘不合作’,收益(3,1);若选‘合作’,参与人2后行动选择‘背叛’(收益(2,4))或‘合作’(收益(5,3))。子博弈完美纳什均衡的路径是?

A.参与人1选合作,参与人2选合作

B.参与人1选合作,参与人2选背叛

C.参与人1选不合作

D.参与人1选不合作,参与人2选背叛

【答案】:C

解析:本题考察动态博弈的子博弈完美纳什均衡(SPNE),需用逆向归纳法。参与人2在参与人1选‘合作’后的选择是关键子博弈:比较‘背叛’(收益4)与‘合作’(收益3),参与人2会选‘背叛’(43)。此时参与人1在初始选择时,对比‘不合作’(收益3)与‘合作’后参与人2选背叛(收益2),因32,参与人1会选‘不合作’。路径为直接结束,无参与人2后续行动。选项A、B错误(参与人1无动机选合作),选项D错误(参与人2在参与人1不合作时不行动)。正确答案为C。

6、在不完全信息静态博弈中,参与人i的信念p(θ_{-i}|θ_i)表示?

A.参与人i对其他参与人类型θ_{-i}的主观概率判断

B.参与人i对自身类型θ_i的客观概率分布

C.参与人i在观察到其他参与人行动后的后验信念

D.参与人i对所有参与人类型的联合概率分布

【答案】:A

解析:本题考察不完全信息博弈中的信念与类型。A选项正确,p(θ_{-i}|θ_i)是参与人i基于自身类型θ_i,对其他参与人类型θ_{-i}的条件概率判断(即后验信念)。B错误,θ_i是参与人私有信息,信念不涉及自身类型的客观概率。C错误,观察到行动后的信念是后验信念,而p(θ_{-i}|θ_i)是先验信念的条件概率。D错误,联合概率分布是p(θ_1,...,θ_n),而信念是条件概率p(θ_{-i}|θ_i)。

7、在不完全信息静态博弈中,“贝叶斯纳什均衡”的核心在于:

A.参与者根据自身类型

文档评论(0)

1亿VIP精品文档

相关文档