2026年大学博弈论期末考试200道附完整答案【精选题】.docxVIP

  • 0
  • 0
  • 约6.91万字
  • 约 100页
  • 2026-02-03 发布于山东
  • 举报

2026年大学博弈论期末考试200道附完整答案【精选题】.docx

2026年大学博弈论期末考试200道

第一部分单选题(200题)

1、无限重复囚徒困境中,单次博弈支付(合作:(-1,-1),背叛:(0,-3),(-3,0),(-5,-5))。双方采用触发策略,维持合作的最小贴现因子δ为:

A.1/5

B.2/5

C.3/5

D.4/5

【答案】:A

解析:本题考察重复博弈合作条件。合作时每阶段收益-1,总现值V=-1/(1-δ);背叛时第一阶段0,后续永远(-5,-5),总现值V_背叛=0-5δ/(1-δ)。合作维持条件V≥V_背叛:-1/(1-δ)≥-5δ/(1-δ)→δ≥1/5。B、C、D贴现因子过高,无法解释触发策略的可行性。

2、无限次重复囚徒困境中,单次博弈支付为(-5,-5)(合作C)、(0,-10)(C,D)、(-10,0)(D,C)、(-3,-3)(D,D)。若贴现因子δ0.5,是否可通过触发策略维持合作?

A.是,合作现值背叛现值

B.否,贴现因子过小

C.是,贴现因子足够大

D.无法判断

【答案】:A

解析:本题考察重复博弈与合作条件。触发策略要求:合作总收益单次背叛+后续惩罚收益。

-合作总收益:-1/(1-δ)(假设单次合作支付-1,此处用经典(-1,-1))。

-背叛总收益:0(单次背叛)+(-5)δ/(1-δ)(后续惩罚)。

令-1/(1-δ)-5δ/(1-δ)→δ1/5=0.2。当δ0.50.2时,合作收益更高,故可维持合作,选A。

3、以下哪项最准确地描述了纳什均衡的核心特征?

A.给定对方策略,每个参与者的策略都是最优反应

B.所有参与者都拥有占优策略,且策略组合为纳什均衡

C.参与者无法通过改变自己的策略获得更高收益(无论对方如何行动)

D.存在一个策略组合,使得每个参与者的收益总和达到最大

【答案】:A

解析:本题考察纳什均衡的定义。纳什均衡的核心是:在给定对方策略的情况下,每个参与者选择自己的最优反应策略,即双方策略互相构成对方的最优反应。选项B错误,因为占优策略均衡(参与者无论对方策略如何都最优)与纳什均衡是不同概念,且占优策略组合只是纳什均衡的一种特殊情况;选项C描述的是占优策略均衡(若存在),而非纳什均衡(纳什均衡仅要求给定对方策略下自身最优,不要求绝对最优);选项D错误,纳什均衡不一定是帕累托最优,总收益最大的情况是帕累托最优而非纳什均衡的必要条件。

4、在序贯博弈中,‘子博弈完美纳什均衡’的核心思想是?

A.通过逆向归纳法剔除不可信的威胁或承诺

B.确保每个参与者在所有阶段都采用占优策略

C.要求所有子博弈都达到纳什均衡,因此无需考虑不可信威胁

D.仅考虑当前阶段的最优策略,无需关注未来阶段的影响

【答案】:A

解析:本题考察子博弈完美均衡的核心逻辑。子博弈完美均衡通过逆向归纳法实现,即从最后一个子博弈开始,逐步向前推导,剔除后续子博弈中不可信的威胁或承诺(如“若对方不合作,我将选择损失更大的惩罚”)。选项B错误,序贯博弈中通常不存在占优策略,且子博弈完美均衡不依赖占优策略;选项C错误,“无需考虑不可信威胁”的表述不准确,子博弈完美均衡的关键是主动剔除不可信威胁;选项D错误,子博弈完美均衡需通过逆向归纳法考虑所有未来阶段的收益。因此正确答案为A。

5、在无限次重复的囚徒困境博弈中,合作得以维持的核心条件是?

A.贴现因子足够大(未来收益现值不小于背叛收益)

B.贴现因子足够小(未来收益现值远小于背叛收益)

C.参与者数量足够多

D.单次博弈收益总和足够大

【答案】:A

解析:本题考察重复博弈的合作条件。触发策略(先合作,对方背叛则永远背叛)的有效性取决于未来合作收益的现值是否大于单次背叛的收益。贴现因子δ表示未来收益的权重,当δ足够大时,无限次合作的总收益(δ+δ2+...)会大于单次背叛的收益(如δ1/2时,合作可持续)。B错误,贴现因子小则未来收益不值钱,倾向背叛;C、D与合作维持无直接关联。

6、猜硬币博弈中,A选“正面”概率为p,B选“猜正面”概率为q,混合策略均衡时p=?

A.1/3

B.1/2

C.2/3

D.1

【答案】:B

解析:本题考察混合策略均衡计算。猜硬币无纯策略均衡,需混合策略平衡。

-A选正面的期望收益:q*0+(1-q)*1=1-q;选反面:q*1+(1-q)*0=q。

-混合策略要求A在两策略间无差异:1-q=q→q=1/2。同理,B的p=1/2。

因此A选正面概率为1/2,正确答案为B。

7、在两阶段序贯博弈中(参与者1先行动,参与者2后行动),参与者2的最优策略选择依据是?

A.参与者1的实际行动选择

B.参与者1的混合策略概率分布

C.参与者2自身的占优策略

文档评论(0)

1亿VIP精品文档

相关文档