- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
期末考试
考试形式:开卷(满分90分)或闭卷(满分100分)
考试时间:第11周晚上上课时间
考试地点:上课课室
考试内容:在下面的六个内容中自选两个或以上的内容写一篇学习心得,要求800字以上。
1、囚徒困境
2、纳什均衡
3、理性假设
4、逆向归纳法
5、重复博弈
6、触发策略
第二章 囚徒困境与纳什均衡
一、经典案例——囚徒困境
二、现实生活中的“囚徒困境”
三、纳什均衡与优势策略
本章内容
一、经典案例——囚徒困境
经典案例——囚徒困境
两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”:
如果两人都坦白则各判8年;
如果一人坦白另一人不坦白,坦白的放出去,不坦白的判15年;
如果都不坦白则各判1年。
这两个囚犯该怎么办呢?是选择互相合作(不坦白)还是互相背叛(坦白)?
1950年,斯担福大学客座教授、数学家图克(Tucker)为了形象地说明博弈过程,构造了著名的“囚徒困境” (prisoners’ dilemma)模型。
经典案例——囚徒困境
囚徒困境的收益矩阵
两人都作出招供的选择,是其优势策略,最符合个体理性的选择。但收益却未必最大,这就是“困境”。
照博弈论的说法,这是本问题惟一的纳什均衡点。只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。这一点就是纳什均衡(Nash Equilibrium)。纳什均衡:局中人单独改变策略不会得到好处的对局策略组合。
当博弈达到纳什均衡,并不一定是对参与者最有利的结果,更不意味着是对整个社会最有利的结果。
纳什均衡
纳什
在“囚徒困境”中表现最好的策略直接取决于对方采用的策略。独立于对方所用策略之外的最好决策是不存在的。
在博弈达到纳什均衡时,在外界环境没有变化的情况下,倘若各方坚持原有的利益最大化原则并理性面对现实,那么这种均衡状况就能够长期保持稳定。
经典案例——囚徒困境
纳什
纳什均衡
纳什均衡是一种“不后悔”均衡。
张三和李四都想要加薪。假如只有一个员工要求加薪,老板会同意,但如果两个人都要求加薪,老板就会生气,并把两个人统统开除。
两个员工都不要求加薪并不是纳什均衡,因为当一方知道另一方没有提出加薪要求时,就会后悔自己的选择。
两个员工都要求加薪也不是纳什均衡,因为两个人事后都会被开除而后悔自己的策略。
这场博弈有两个纳什均衡点,张三要求加薪而李四不要求;或李四要求而张三不要求。
二、现实生活中的“囚徒困境 ”
“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。
[明]宋濂《宋文宪公全集》记有一个故事:
玉寅生与三乌丛臣是朋友,他们曾歃血盟誓:“我辈应自励,他日入朝为官,绝不趋炎附势。如有违此誓,请神明惩罚。”
没多久,他们一起到晋国为官。当时赵宣子是晋王宠臣,各大夫均奔走于他家。玉寅生重申以前的誓言,三乌丛臣也说:“说过的话犹在耳畔,岂敢忘记!”
但三乌丛臣后悔当初的誓言,又怕玉寅生知道。于是在一个大清早,鸡刚一报晓,他就前去拜望赵宣子。一进门,他忽然看到东边走廊有个人坐在那里,他走前举灯一照,那个人原来是玉寅生。
现实生活中的“囚徒困境 ”
现实生活中的“囚徒困境 ”
(升官或落选,升官或落选)
(落选,升官)
三乌丛臣
玉寅生
不巴结
巴结
不巴结
巴结
(升官,落选)
(升官或落选,升官或落选)
取决于谁巴结得更到位
如果巴结上司会有升官的机会,则其他人也面对同样的局面。假定两个人竞争一个官职,则
双方均巴结,则双方成本高;双方均不巴结,则双方成本低。然而“巴结”是双方的最佳的策略。
电信价格竞争的“囚徒困境”
学生的囚徒困境
数十道“减负令”难见效
中小学生课业负担不减反增
????
仅1985年至2000年的15年里,中央就下达“减负令”49次。减轻中小学生过重负担喊了20多年,实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。
为什么数十道“减负令”难见效?
三、纳什均衡与优势策略
位置博弈
国美与苏宁为什么总喜欢贴身撕杀?
位置博弈
麦当劳和肯德基为什么总是相邻设店?
位置博弈
假设某条路上的顾客流量是均匀分布的,且顾客对麦当劳和肯德基无偏好,而总是乐意惠顾距自己最近的快餐店。
在顾客均匀散布的情况下,从资源的最佳配置来看,麦当劳、肯德基应该分别开在1/4、3/4处是最优,各自拥有1/2的顾客量,同时顾客到快餐店的总距离最短。
位置博弈
出于理性考虑,肯德基肯定会想到:如果将店铺从3/4点处向左移一点,将从麦当劳抢夺走部分顾客。而麦当劳自然也想到从1/4点处向右移动以争取更多的顾客。
不难想象,双方博弈的结果将使他们的店铺设置在l/2中点附近达到纳什
文档评论(0)