博弈论课程的.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论课程的

博弈论课程 第一课 什么是博弈论 博弈论研究策略形势策略形势书面定义是行为影响结果 然而结果不仅 取决于你的行为 还取决于其他人的行为 如果你选α而你对手选β那么你得A你对手得C 如果你们都选α 那么你们都得B- 如果你选β你对手选α你得C你对手得A 如果你们都选β 你们都得B+ a β a B- B- CA β AC B+ B+ 无论别人怎么选,如果选α得到的结果严格优于β,那么α相对于β是个严格优势策略 结论一——不要选择严格劣势策略 我不选择严格劣势策略的原因是要我选了优势策略,我在每次博弈都得到更好的收益。为什我不选择严格劣势策略,因为我要是选优势策略不管别人怎么选,我总得到更好的结果。 结论二——理性人的理性选择造成了次优的结果。 结论三——汝欲得之,必先知之。 结论四——站在别人的立场上去分析他们会怎么做。 结论五——耶鲁大学的学生很自私。 第二课 如何化解囚徒困境:沟通本身并不能化解囚徒困境,你可以在减排问题上一直高谈阔论,但当你回家时,你仍然会开着你的悍马,每天洗十六次热水澡,我们依然在大量排碳,你大谈特谈你在多么努力地做家庭作业,但是回家后如果你依旧偷懒,这还是无济于事实际上 如果其他人正在努力工作,或者正在尽量减少碳排量,你总会有想偷懒的动机,或者总是继续大量排碳,我们需要跳出这个思维定势,我们可以考虑制定协约,我们可以考虑各国之间签订协约,我们可以考虑制定规章制度只要改变收益 这些方法都有效,这不是说说而已 但它确实改变了结果,改变了收益 也改变了动机。另一个重要的东西是我们可以考虑把单次博弈转化成重复博弈 然后看看是否有效我们以后再来学习这部分内容。 还有一种方法 但我们必须慎用 是教育大家做一个好人 博弈的要素有哪些 第一:参与人 我们用小写i和小写j来表示 第二:策略 我们用小写si来表示参与人i的某个策略 我们需要把这个特定的策略和 参与人i的可能策略集合区别开来,我们用大写的Si来表示策略集合,即参与人i的所有可能策略的集合。我们用不带下标的小写s来表示某一次博弈. 一次博弈中所有人的策略集合称它为一个策略组合。s-i表示除了i外其参与人的策略。 第三:收益 我用符号U来表示参与人的收益 参与人i的收益Ui。由所有参与人的策略决定,当然也包括她自己的策略,简写应该是Ui(s) 它由策略组合决定。 优势策略的定义——参与者i的策略si严格劣于参与者i的另一个策略si。现在我们要使用符号了。在其他参与人选择s-i时,选择si的收益UI(si)严格优于此情况下选si的收益UI(si) 最重要的一点是对所有s-i均成立。用文字来描述就是参与人i的策略si严格劣于si,如果si总是更好的选择,即总能给参与人i带来更高的收益而无论其他参与人怎么选。 博弈推理过程——首先假设人是理性的,接着不仅你要站在别人的立场上思考别人的收益是什么样的,你还要站在别人的立场上思考他们在博弈时有多老练,并且你需要考虑到他们认为你有多老练。你还需要考虑到他们认为你认为他们认为你在博弈时有多老练。 相互知识并不是公共知识共同知识并不只是我知道什么还有我是否知道别人知道。 第三课 中间选民定理——处在中间位置的选民,实际上他们不止左右了选举结果而且还决定了那些政策可以施行。加油站趋向设立于同一个路口避免自己因为选址的问题而被淘汰出局,商业普遍集中以试图争取附近的客源,都适用于这一模型。 迭代剔除劣势策略——,从可供选择的所有策略中选出严格劣势策略,不断的将劣势策略予以剔除从而得出更加优越的方案。 第四课 最佳对策——在你已经对别人如何行动有一定信念时,你能想到的最佳的策略。你的对手会怎么做,其他人又会怎么做。你可以把这个信念理解成让你的策略合理化的理由。 所以如果你为别人打工,你的老板问你为什么做出这样的选择,如果你针对自己的信念做出了最佳对策。你就可以说 我是所以这么做 是因为我认为其他人会那么做 因为那的确是在这种信念下的最佳策略。 结论一 不要选择一个在任何情况下都不是最佳对策的策略  纳什均衡的定义假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的 ?? 纳什均衡 最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不

文档评论(0)

ayangjiayu3 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档