- 38
- 0
- 约2.7千字
- 约 25页
- 2016-11-28 发布于湖北
- 举报
博弈论模型
博弈论模型问题的主要特征
1、有参加竞争的对手
2、每个竞争对手都有自己可供选
择的竞争策略
3、对于每个竞争对手选定的策略,
大家都对应有一个收入
博弈论模型
纳什均衡——非合作博弈均衡
假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略,从而使自己利益最大化。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡是一种非合作博弈状态。
纳什均衡——非合作博弈均衡
图中红点为鞍点,或者称为一个Nash均衡
Company Logo
Diagram
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
纳什均衡——非合作博弈均衡
智猪博弈模型
假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的踏板。
踏一下踏板会有10个单位的猪食进槽但是谁按按钮就会首先付出2个单位的成本。
1、若大猪先到槽边,大小猪吃到食物
的收益比是9∶1;
2、同时到槽边,收益比是7∶3;
3、小猪先到槽边,收益比是6∶4。
智猪博弈模型
智猪博弈模型
在两头猪都有智慧的前提下,小猪该如何选择?
前提:
1、若大猪先到槽边,大小猪吃到 食物的收益比是9∶1;
2、同时到槽边,收益比是7∶3;
3、小猪先到槽边,收益比是6∶4。
智猪博弈模型
用博弈论中的报酬矩阵
可以更清晰的刻画出小猪的选择:
行动
等待
行动
5、1
4、4
等待
9、-1
0、O
小猪
大
猪
智猪博弈模型
从矩阵中可以看出,
当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;
当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。
综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。
智猪博弈模型
“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。如股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资。。。
思考:如何认识小猪“搭便车”现象?
零和博弈
零和博弈又称“零和游戏”,与非零和博
弈相对,是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。双方不存在合作的可能。
“零和游戏”的基本内容:游戏者有输有赢,一方所赢正是另一方所输,游戏的总成绩永远是零。
非零和博弈
非零和博弈是一种非合作下的博弈,博弈中各方的收益或损失的总和不是零值,它区别于零和博弈。
在这种状况时,自己的所得并不与他人的所失的大小相等,连自己的幸福也未必建立在他人的痛苦之上,即使伤害他人也可能“损人不利己”,所以博弈双方存在“双赢”的可能,进而合作。
譬如,在恋爱中一方受伤的时候,对方并不是一定得到满足。也有可能双方一起能得精神的满足。也有可能双方一起受伤。通常,彼此精神的损益不是零和的。
智猪博弈就是非零和的矩阵博弈。
囚徒困境模型
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(相关术语称互相“背叛”),则二人同样判监2年。
囚徒困境模型
监牢
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?
囚徒困境模型
用表格概述如下:
甲沉默
甲认罪
乙沉默
甲0.5
乙0.5
甲0
乙10
乙认罪
甲10
乙0
甲2
乙2
囚徒困境模型
试设想困境中两名理性囚徒会如何作出选择:
若对方沉默,背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
囚徒困境模型
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均
您可能关注的文档
- 安全评价师(二级)教育总汇.ppt
- SAP财务管理-王纹(精华)研究报告.doc
- 第1章DSP处理器研究报告.ppt
- 安全人机工程复习总汇.ppt
- 成本结算培训手册研究报告.ppt
- 安全生产标准化评审方法和技巧总汇.ppt
- 安全生产典型违章300条总汇.docx
- 成本压缩管理与解决之道浅谈研究报告.ppt
- 第1章DSP综述研究报告.ppt
- 安全生产管理制度文本总汇.doc
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
原创力文档

文档评论(0)