- 1
- 0
- 约7.54千字
- 约 73页
- 2018-10-17 发布于天津
- 举报
博弈论和对策行为培训教材.ppt
第十一章
博奕论和对策行为 ;博弈论和对策行为 ;博弈论和对策行为 ;博弈论和对策行为 ;博弈论和对策行为 ;博弈论和对策行为 ;三.支付或收益(payoffs): ;例1. 囚徒困境(prisoner’s dilemma) ;例1. 囚徒困境(prisoner’s dilemma) ;例1. 囚徒困境(prisoner’s dilemma) ;定义1: 给定其它局中人的策略s,局中人i的最优反应 记为s,是指能给他带来最大收益的策略,即 ;定义2: 一个策略组合s*=(s1*,s2*,…,sn*)被称为纳什均 衡是指,对于所有 的 i, ; 在囚徒困境中,考虑囚徒A对他人的最优反应。如果给定囚徒B的策略是“坦白”,那么对囚徒A来说,采取“坦白”策略得到的收益是-8,采取“抵赖”策略得到的收益是-10,显然“坦白”为好;同理,如果给定囚徒B的策略是“抵赖”,对囚徒A来说,“坦白”也比“抵赖”好。因此,囚徒A对囚徒B的最优反应是“坦白”。
对囚徒B作同样分析:如果囚徒A的策略是“坦白”,则他采取“坦白”策略为好;如果囚徒A的策略是“抵赖”,他还是采取“坦白”策略好,所以囚徒B对囚徒A的最优反应也是“坦白”。
两个最优反应形成了一个策略组合(坦白,坦白),这就是一个纳什均衡。 ;
您可能关注的文档
最近下载
- 华为热的设计培训教材.pdf VIP
- 在线网课学习课堂《科学研究方法与论文写作(复大)》单元测试考核答案.docx VIP
- 深度解析(2026)《GBT 29711-2023焊缝无损检测 超声检测 焊缝内部不连续的特征》.pptx VIP
- 最新人教版八年级物理第十章浮力单元测试卷及答案(100分版).pdf VIP
- 2024年人教版化学中考知识点必背.docx VIP
- 陕西杨宪伟设计椭圆及其标准方程.docx VIP
- 2026年英语培训市场创新投资机会与教学分析报告.docx VIP
- 2025江苏常州市自然资源和规划局下属事业单位招聘6人备考题库附答案.docx VIP
- 南京地铁校招笔试题目及答案.doc VIP
- 2026年两会精神专题.ppt VIP
原创力文档

文档评论(0)