2026年大学博弈论期末考试200道(各地真题).docxVIP

  • 0
  • 0
  • 约7.13万字
  • 约 102页
  • 2026-02-13 发布于山东
  • 举报

2026年大学博弈论期末考试200道(各地真题).docx

2026年大学博弈论期末考试200道

第一部分单选题(200题)

1、猜硬币博弈中,参与人1(先手)和参与人2(后手)的策略均为“正面(H)”或“反面(T)”,支付规则:若猜中(1对1),猜中方得1,猜错方得-1。以下关于混合策略纳什均衡的描述正确的是:

A.参与人1的混合策略为(0.5,0.5),参与人2的混合策略为(0.5,0.5)

B.参与人1的混合策略为(1,0),参与人2的混合策略为(1,0)

C.混合策略均衡不存在纯策略均衡

D.混合策略均衡中参与人永远不会选择纯策略

【答案】:A

解析:本题考察混合策略纳什均衡的计算。猜硬币博弈中纯策略均衡不存在(如(H,H)时参与人2会偏离),需用混合策略。设参与人1选H的概率为p,T的概率为1-p;参与人2选H的概率为q,T的概率为1-q。参与人1的期望收益:q*(-1)+(1-q)*1=1-2q。为使参与人1无偏离动机(混合策略),需1-2q=0?q=0.5;同理参与人2的期望收益1-2p=0?p=0.5。因此双方混合策略均为(0.5,0.5),选项A正确。选项B是纯策略(1,0),参与人1会偏离;选项C错误(混合策略存在但纯策略不存在);选项D错误(混合策略中参与人以正概率选择纯策略)。

2、在猜硬币博弈中(参与人A猜正面/反面,参与人B猜正面/反面,若两人猜中结果相同,A得1,B得-1;若不同,A得-1,B得1),其混合策略纳什均衡的期望收益是多少?

A.0

B.1

C.-1

D.无法确定

【答案】:A

解析:本题考察混合策略纳什均衡的期望收益计算。猜硬币是零和博弈,参与人A以0.5概率选正面/反面,B同样以0.5概率选正面/反面。对A而言,期望收益=0.5×[0.5×1+0.5×(-1)]+0.5×[0.5×(-1)+0.5×1]=0.5×0+0.5×0=0。因此混合策略均衡期望收益为0。B错误,因猜中概率对称,无正收益;C错误;D错误,均衡收益可明确计算。

3、在动态博弈中,求解子博弈完美纳什均衡的常用方法是?

A.逆向归纳法(从最后一个子博弈开始倒推)

B.划线法(标记每个参与人的最优反应)

C.严格占优策略法(寻找严格占优策略)

D.混合策略法(计算混合策略概率)

【答案】:A

解析:本题考察子博弈完美纳什均衡的求解方法。子博弈完美纳什均衡需剔除动态博弈中的“不可信威胁”,常用方法是“逆向归纳法”:从最后一个行动者的选择开始,倒推每个参与人的最优策略。选项A正确。选项B“划线法”是静态博弈纯策略纳什均衡的标记方法;选项C“严格占优策略法”适用于占优策略均衡(静态博弈);选项D“混合策略法”用于处理随机选择策略,均非动态博弈子博弈完美的求解方法。因此A正确。

4、无限重复囚徒困境中,单次博弈支付(合作:(-1,-1),背叛:(0,-3),(-3,0),(-5,-5))。双方采用触发策略,维持合作的最小贴现因子δ为:

A.1/5

B.2/5

C.3/5

D.4/5

【答案】:A

解析:本题考察重复博弈合作条件。合作时每阶段收益-1,总现值V=-1/(1-δ);背叛时第一阶段0,后续永远(-5,-5),总现值V_背叛=0-5δ/(1-δ)。合作维持条件V≥V_背叛:-1/(1-δ)≥-5δ/(1-δ)→δ≥1/5。B、C、D贴现因子过高,无法解释触发策略的可行性。

5、动态博弈中,用逆向归纳法求解的均衡是?

A.占优策略均衡

B.纳什均衡

C.子博弈完美纳什均衡

D.重复博弈均衡

【答案】:C

解析:本题考察子博弈完美均衡的求解方法。

-A错误:占优策略均衡是静态博弈概念,适用于参与者同时行动的场景;

-B错误:纳什均衡可能包含“不可信威胁”(如动态博弈中先行动者的威胁),而子博弈完美均衡剔除此类威胁;

-C正确:逆向归纳法通过从最后子博弈开始倒推,确保每个子博弈内的策略都是最优的,得到的是子博弈完美纳什均衡;

-D错误:重复博弈是重复进行多次的静态博弈,与动态博弈的子博弈完美均衡无关。

6、在博弈论中,“占优策略”的定义是?

A.无论其他参与者采取什么策略,该策略都是自身的最优反应

B.存在一个策略组合,使得每个参与者都无法通过单独改变策略而提高收益

C.参与者在观察到对方策略后,选择对该策略最优的反应

D.参与者在重复博弈中逐渐稳定下来的策略

【答案】:A

解析:本题考察占优策略的定义。选项A正确,占优策略是指无论对方采取何种策略,自身选择该策略的收益都不低于其他策略,即该策略始终是最优反应。选项B描述的是纳什均衡的定义(至少存在一个策略组合,给定对方策略,自己无法改进),但纳什均衡不一定要求是占优策略均衡。选项C是“最优反应

文档评论(0)

1亿VIP精品文档

相关文档