2026年大学博弈论期末考试200道含答案【轻巧夺冠】.docxVIP

  • 0
  • 0
  • 约7.3万字
  • 约 105页
  • 2026-02-03 发布于山东
  • 举报

2026年大学博弈论期末考试200道含答案【轻巧夺冠】.docx

2026年大学博弈论期末考试200道

第一部分单选题(200题)

1、贝叶斯纳什均衡的核心是?

A.参与者在给定自身信息下的最优策略组合

B.所有参与者策略互为最优反应

C.通过信号传递达成的均衡

D.子博弈完美的均衡路径

【答案】:A

解析:本题考察贝叶斯纳什均衡定义。贝叶斯纳什均衡(BNE)是不完全信息静态博弈的均衡,核心是:每个参与者根据自身信息(类型)选择策略,使期望收益最大化,且策略组合是对对方策略的最优反应。

B为纳什均衡(完全信息),C为信号传递(动态),D为子博弈完美(动态),均不符,选A。

2、在猜硬币游戏中,参与者1策略为“正面(H)”或“反面(T)”,参与者2策略为“猜正面(G)”或“猜反面(F)”。支付规则:若1出H且2猜G,1得1,2得1;1出H且2猜F,1得-1,2得-1;1出T且2猜G,1得-1,2得-1;1出T且2猜F,1得1,2得1。该博弈的混合策略纳什均衡中,参与者1选择H的概率是?

A.0%

B.50%

C.75%

D.100%

【答案】:B

解析:本题考察混合策略纳什均衡。猜硬币无纯策略纳什均衡,需用混合策略。设1以概率p选H,1-p选T;2以概率q选G,1-q选F。参与者1的期望收益:若2选G,1得p*1+(1-p)*(-1)=2p-1;若2选F,1得p*(-1)+(1-p)*1=1-2p。混合均衡时,2对G和F无差异,即2p-1=1-2p→p=0.5。同理参与者2的q=0.5。因此参与者1选H的概率为50%,选项B正确。选项A、D为纯策略,C非均衡概率,错误。

3、在不完全信息古诺模型中,若企业i的成本函数是私人信息,其他企业对其成本有先验信念,则该模型的均衡类型是?

A.纯策略纳什均衡

B.贝叶斯纳什均衡

C.子博弈完美纳什均衡

D.混合策略纳什均衡

【答案】:B

解析:本题考察不完全信息博弈的均衡类型。不完全信息下,参与者的类型(如成本参数)为私人信息,需通过贝叶斯法则更新信念。贝叶斯纳什均衡(BNE)允许参与者在不确定信息下选择策略,且策略需满足给定信念下的最优性。纯策略纳什均衡假设信息完全;子博弈完美适用于完美信息动态博弈;混合策略适用于策略不确定性,未涉及信念更新。

4、在无限次重复的囚徒困境博弈中,参与者为实现合作(双方均选择沉默),最可能采用的策略是?

A.以牙还牙策略(Tit-for-Tat)

B.一次性背叛策略

C.随机终止合作策略

D.固定选择沉默策略

【答案】:A

解析:本题考察重复博弈的合作机制。无限次重复博弈中,“以牙还牙”策略(初始合作,对方背叛则永久背叛)能通过惩罚机制维持合作:若对方短期背叛(如选择坦白),后续合作收益将因惩罚大幅降低,从而约束参与者偏离合作。B选项“一次性背叛”会破坏合作;C选项“随机终止”无法形成稳定的合作预期;D选项“固定沉默”在对方偏离时无约束,无法维持合作。因此正确答案为A。

5、不完全信息求职博弈中,企业为高薪(概率0.6)或低薪(0.4),求职者申请期望收益6,不申请0,贝叶斯均衡策略是?

A.无论企业类型都申请

B.仅高薪时申请

C.仅低薪时申请

D.不申请

【答案】:A

解析:本题考察贝叶斯纳什均衡。求职者无法观察企业类型,只能基于先验概率计算期望收益:

-申请期望收益:0.6*10+0.4*0=60(不申请收益)。

-贝叶斯均衡要求求职者选择期望收益最高的策略,即“申请”。其他选项中,B、C需区分企业类型(不可观察),D收益更低。正确答案为A。

6、在囚徒困境博弈中,每个参与者的占优策略是?

A.保持沉默

B.坦白

C.只有对方沉默时才保持沉默

D.只有对方坦白时才保持沉默

【答案】:B

解析:本题考察占优策略的概念。囚徒困境中,无论对方是否坦白,参与者选择“坦白”的刑期均更短(如:若对方沉默,坦白判0年优于沉默判1年;若对方坦白,坦白判8年优于沉默判10年),因此“坦白”是占优策略。选项A错误,沉默不满足占优策略条件;选项C和D错误,占优策略与对方行为无关,仅取决于自身收益。

7、在以下哪种博弈中,参与人需要使用混合策略才能达到纳什均衡?

A.猜硬币游戏(一方猜正,一方猜反,猜中赢)

B.囚徒困境

C.智猪博弈

D.斯塔克伯格模型(序贯博弈)

【答案】:A

解析:混合策略纳什均衡用于无纯策略均衡的博弈。A猜硬币游戏中,参与人1若选‘正面’,参与人2必选‘反面’;若选‘反面’,参与人2必选‘正面’,无纯策略均衡,需以一定概率随机选择(混合策略)。B、C存在纯策略纳什均衡(囚徒困境:背叛;智猪博弈:大猪按,小猪等);D斯塔克伯格模型是序贯博弈,用逆向归纳法求子博弈完美均衡,无需混合策略。故A正确。

8、在标准的囚徒困境博弈中,

文档评论(0)

1亿VIP精品文档

相关文档