- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 博弈论的假定与博弈分类第1节 博弈的定义及构成要素先看一个例子。例2-1.囚徒困境.两个共同作案偷窃的小偷被警察抓住,被带进警察局单独关押。他们面临的“政策”是“坦白从宽,抗拒从严”,具体的政策是:如果一方与警方合作,招认并供出自己与对方以前所做违法之事,而对方不招认,招认方无罪释放,不招认的另一方则会被判重刑10年;如果双方都与警方合作共同招认,各被判刑5年;而如果双方均不承认有罪,因警察找不到他们以前违法的证据,只能对他们的小偷行为进行惩戒,各被判刑3个月。这两个小偷如何作出选择?甲乙不招认招认不招认各被判刑3个月甲:当场释放乙:被判刑10年,招认甲:被判刑10年乙:当场释放各被判刑5年这个博弈便称为囚徒困境博弈(prisoners’ dilemma )。普遍认为,囚徒困境最先是由普林斯顿大学的塔克(AlbertTucker)教授于20世纪50年代提出的。这个博弈模型是一类现实原型的抽象,该博弈被广泛地讨论;在后面我们将详细地分析它。上述直观的博弈表述方式被称为支付矩阵,用之可表示2人博弈。该矩阵为诺贝尔奖获得者托马斯?谢林最先使用的,该发明对于博弈论的普及意义重大。我们说过,一个博弈是其收益相关的两个或两个以上的参与人的策略互动。在博弈的标准式表示中,每个参与人同时选择一个策略,所有参与人选择策略的组合决定每个参与人的收益。形式地,一个博弈可定义为:定义2.1. 在一个n人博弈的标准式中,一个博弈可定义为:G={S1,S2,…,Sn; u1,u2,…,un},其中S1,S2,…,Sn为参与人的策略空间;u1,u2,…,un为参与人的收益函数。因此,简单地说,一个博弈涉及:第一,两个或两个以上的参与人;第二,参与人的策略空间;第三,收益。对于以上述形式描述或定义的博弈,其“解”是什么?为了得到“解”概念,我们得先给出博弈论基本假定。第2节 博弈论中的基本假定基本假定:在博弈中每个参与人是理性的是博弈参与人之间的公共知识。这里涉及两个问题:第一,什么是理性;第二,什么是公共知识。我们先回答第二个问题。我们说:一个命题p是公共知识是指,每个人知道p,且每个人知道p,每个人都知道p,……或者p是公共知识指,每个人知道p且每个人知道p是公共知识。在下面的章节中我们会详细地讨论这个概念。但对于第一个问题“什么是理性的”,我们很难给出准确回答。理性本指推理要符合逻辑规则。在决策中,这里的逻辑规则是广义的,它不仅包括形式逻辑的推理要求,而且包括决策规则。对之,迈尔森说:“如果一个决策者在追逐其目标时能够前后一致地做决策,我们就称他是理性的(rational)。”这样,理性意味着逻辑一致性或无矛盾性。同时他说:“在基于决策理论的基本结论而建立起来的博弈论中,我们假设每个局中人的目标是追求其个人期望支付值的最大化,支付则是用某个效用尺度来度量的。”(P2)这样,理性决策者应该按使自己的期望支付最大化的方式去做决策。由于一个博弈涉及多个理性主体,由此,博弈论是研究交互理性(Interactive Rationality)。第3节 参与人的目标:最大化期望效用人们采取行动是为了获得收益,在不同行动进行权衡其目的在于获得最大收益。我们如何刻画收益呢?我们往往用效用来刻画收益。效用是某个物品或行动结果给主体所带来的满足程度。这个满足程度与物品的量或刻画行动结果的参数之间是一个函数关系,这便是效用函数。然而,我们所采取的行动与结果及效用之间往往是不确定性关系。我进行房产投资,是否能够从房价上涨中获益,这是不确定的;我将钱存入银行,获得本金及利息的确定性稍高,但没人能够保证这种确定是百分之百。如何刻画这种不确定性决策?参与人决策的类型:确定性决策与不确定性决策。从上世纪20年代开始,拉姆齐(F.Ramsey)、萨维奇(Savage)萨维奇和冯诺依曼等人发展了决策的期望效用理论。在确定性条件下,参与人的目标是效用最大化;在不确定性条件下决策者的目标是期望效用最大化。博弈论的逻辑基础是贝叶斯决策理论,或主观主义决策理论。贝叶斯决策理论认为,理性决策者的行为被认为是对某个物品或结果的效用值与实现这个效用者的盖然性之间乘积的盘算。这里理性决策者所盘算或考虑的便是期望效用。这里,所涉及的两个概念效用与概率都是对主体的主观行为的度量,它们是主观值。我们说它们是主观的,指的是不同的人对同样的物品的效用评价及对同一个事件的发生盖然性能够是不同的。效用与货币支付不成线性比例。帮助我们理解效用概念的两个决策悖论圣彼得堡悖论与交换悖论。例2.2.圣彼得堡悖论。你和庄家进行这样一个投掷硬币的赌博。你给予庄家一定数量的赌金以进行如下赌博:若第一次硬币出现反面,游戏终止,你无所得,而若出现正面,庄家输2元给你,且赌博投继续进行;若第二次投掷硬币,硬币出现反面,游戏终止;而
您可能关注的文档
最近下载
- 规范汉字书写 标点符号用法举例 标点符号用法举例.pptx VIP
- 职业院校技能大赛--Z-30“工程测量”赛项理论考试题库.doc VIP
- 安全员C证考试题库(精练).docx VIP
- 2018年四川省职业院校技能大赛工程测量赛项中职组理论考试题库.docx VIP
- 2020年山东省职业院校技能大赛中职组工程测量赛项理论试题.doc VIP
- 第十六届山东省职业院校技能大赛中职工程测量赛(教师组)理论试题.docx VIP
- 中央八项规定精神专题党课讲座PPT模板.pptx VIP
- 第十六届山东省职业院校技能大赛中职工程测量赛项(学生组)理论试题.docx VIP
- 全频带阻塞干扰刘慈欣小说读书分享PPT.pptx VIP
- 作子女生命的教练.PPT
文档评论(0)