(完整版)耶鲁公开课--博弈论笔记.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
耶鲁公开课—博弈论笔记 第一节、 名词解释 优势策略( Dominant strategy ):不论其他局中人采取什么策略,优势策略对一个局中人而言都是最好的策略。 即某些时候它胜于其他策略,且任何时候都不会比其他策略差。 注: 1、“优势策略”的优势是指你的这个策略对你的其他策略占有优势,而不是无论对手采用什么策略,都占有优势的策略。 2、采用优势策略得到的最坏的结果不一定比采用另外一个策略得到的最佳的结果略胜一筹。 严格劣势策略 (strictly dominated strategy) :被全面的严格优势策略压住的那个策略, 也就是说不是严格优势策略以外的策略。 弱劣势策略: 原来不是严格劣势策略, 但是经过剔除严格劣势策略后, 这个策略就成了严格劣势策略。 例:囚徒困境 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁, 并不知道对方选择; 而即使他们能交谈, 还是未必能够尽信对方不会反口。 就个人的理性选择而言, 检举背叛对方所得刑期, 总比沉默要来得低。 试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样, 所以二人的理性思考都会得出相同的结论——选择背叛。 背叛是两种 策略之中的支配性策略。 因此,这场博弈中唯一可能达到的纳什均衡, 就是双方参与者都背叛对方,结果二人同样服刑 2 年。 例:协和谬误 20 世纪 60 年代,英法两国政府联合投资开发大型超音速客机,即协和飞机。该种飞机机身 大、装饰豪华并且速度快, 其开发可以说是一场豪赌, 单是设计一个新引擎的成本就可能高达数亿元。难怪政府也会被牵涉进去,竭力要为本国企业提供更大的支持。 项目开展不久, 英法两国政府发现: 继续投资开发这样的机型,花费会急剧增加, 但这样的设计定位能否适应市场还不知道; 但是停止研制也是可怕的, 因为以前的投资将付诸东流。随着研制工作的深入, 他们更是无法做出停止研制工作的决定。 协和飞机最终研制成功,但因飞机的缺陷(如耗油大、噪音大、污染严重等)以及运营成本太高,不适合市场竞争,英法政府为此蒙受很大的损失。 在研制过程中, 如果英法政府能及早放弃,本来可以使损失减少, 但他们没能做到。最 后,英国和法国航空公司宣布协和飞机退出民航市场, 才算是从这个无底洞中脱身。 这也是“壮士断腕”的无奈之举。 人们往往会陷入类似的误区: 一项工作的成本越大, 对它的后续投入就越多。 其实不仅是在制造协和飞机这样的重大项目上, 就是在日常的生活中, 人们在决定是否继续做一件事情的时候, 不仅是看它对自己有没有好处, 而且也过于注意自己是不是已经在这件事情上面有过投入。 我们把那些已经发生、不可收回的支出,如时间、金钱、精力称为“沉没成本”。沉没的意思是说,你在正式完成交易之前投入的成本,如果一旦交易不成,就会白白损失掉。但如果对沉没成本过分眷恋,就会继续原来的错误,造成更大的亏损。 在第一节课中得出的五个结论: 1、不要选择劣势策略 2、理性选择导致次优结果 、站在他人立场分析他们会怎么做 、先弄清你想要的,才能得到你想要的 、人人都是自私的 第二节、 囚徒困境的解决之道: 1、多次博弈; 2、设立规章制度,惩罚违规者; 3、思想教育(效果待定)。 博弈的要素:参与者 i ;策略 S;收益 U。 符号的定义: Si 表示参与者 i 的策略。 S-i 表示除参与者 i 以外其他人的策略。 Ui 表示 i 的收益。 名词解释: 共同知识: 我知道这件事;你也知道这事;我知道你知道这事;你知道我知道你知道这事这事;此后循环。 案例:老师在课堂上让每位学生从 1-100 中选择一个数字。选择到最接近全班平均数的 2/3 的学生为胜利者。学生共有 50 个左右。胜利者平分奖金 5 美元。 解决方案: step1 、假设每个人都选择 100,平均数 100*2/3 = 66.66 。所以不能选择 67-100 之间的数(严格劣势策略)。现实中有两名学生选择了。 step2 、剔除了 step1 中的严格劣势策略后,重复迭 代,66*2/3 = 44。所以不能选择 44-67 之间的数 (弱劣势策略) 。现实中有四名学生选择了。 step3 、 44*2/3 = 29,所以不能选择 29-44 之间的数。 现实中有 13 个左右选择了 30-34 区间,。选择这个数区间的学生想法是 1-100 平均数是 50, 50*2/3 = 33,所以选择 33 附近的数可能比较接近。这些学生低估了其同班同学的智商。 step4 、 29*2/3 = 19,所以不能选择 19-29 之间的数

文档评论(0)

153****3726 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档