竞争中的博弈与取胜的逻辑-南开大学.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
竞争中的博弈与取胜的逻辑 任晓明 什么是博弈? 一天晚上你参加一个聚会,屋里有很多人,你玩得很开心。 这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生,你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢着从两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择得是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈. 这就是博弈! 什么叫博弈? 博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英文中game就是人们遵守一定规则的活动,进行游戏的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Game。在英文中game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory 翻译成博弈论或者对策论,是恰当的(潘天群,2001) 。 博弈论的50年历史。 博弈论的开创者为冯 诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。冯 诺意曼是著名的数学家,他对世界上第一台计算机的发明做出了巨大贡献,他去世时博弈论还没有对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定只颁发给在世的学者。谈到博弈论不能不谈到博弈论天才纳什(John Nash)。美国电影《美丽心灵》艺术地再现了这个天才传奇般的人生经历,1994年诺贝尔经济学奖得主,30多岁得了严重的精神分裂症,又奇迹般恢复。纳什的开创性论文——《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。2005年,另一位博弈论奇才罗伯特·奥曼再次获得诺贝尔经济学奖。今天博弈论已发展成为一个较完善的学科,正在成为一门显学。 博弈论对社会科学的意义 博弈论正成为社会科学研究“范式”中的核心工具,以至于我们可以称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。日本人提出了一种博弈的逻辑,有学者声称要用博弈论重新改写经济学。现在博弈论正渗透到各门社会科学,更重要的是它正深刻地改变着人们的思维。 博弈涉及的内容 1.博弈涉及到至少两个独立的博弈参与者(player)。 “囚徒博弈”或“囚徒困境”是一个被广泛谈论和研究的博弈。 两个共同作案偷窃的小偷被带进警察局单独关押,如果一方与警方合作,招认并提供出自己与对方以前所做违法之事,而对方不招认,招认方将不受重刑,无罪释放,另一方则会被判重刑10年;如果双方都与警方合作共同招认,各被判刑5年;而如果双方均不承认有罪,因警察找不到其他证明他们以前违法的证据,则只能对他们的小偷进行惩戒,各判刑3个月。这两个小偷如何做出选择? 继续 在这个囚徒困境中,囚徒的最后结果——是当场释放还是被判行(10年、5年、3个月),不仅取决于该囚徒的决定,而且还取决于另外一个小偷的决定。 2.博弈涉及行动者存在着策略选择的可能, 博弈论用策略空间来表示参与者可以选择的策略。我们进行决策选择时,存在这样的情况:虽然我们知道我们可以采取的各种备选策略,同时也知道各种策略下的结果,但是这些结果是不确定的,此时,我们应当如何进行策略选择? 渔夫和鱼的故事。 一个渔夫用网在海里捉到了一条小鱼。渔夫很失望。小鱼对渔夫说:“我太小了。你把我放了,等我长大了,你再抓我,不是更划算吗?”渔夫:“你的话有道理。你确实太小了。但放了你则是愚蠢的,因为放了你之后,我怎么能抓到你呢?”渔夫没把小鱼放掉。 期望效用极大化 渔夫面临两个决策:“不放走小鱼”、“放走小鱼”。渔夫选择“不放走小鱼”的收益是确定的,即收益为“小鱼”;而选择“放走小鱼”的策略,收益是不确定的:或者为一无所有,或者为获得“大鱼”。这里,当小鱼长大成为“大鱼”之后,渔夫抓住它的可能性或概率几乎为0。小鱼诱惑渔夫放走它,对于渔夫,放弃眼前的小利,换取未来的大利是合算的;然而如果未来的大利是不确定的,那么放弃眼前的小利则是愚蠢的。渔夫没有把小鱼放掉,他的决策是合理的。 渔夫进行决策选择时遵从的是期望效用极大化原理。  3参与者在不同策略组合下会得到一定的支付 我们往往用支付矩阵来表示参与者在各种策略组合下的支付,囚徒困境的支付矩阵为: 甲和乙都不招认各判刑3个月 乙不招认而甲招认:乙判刑10年甲当场释放 乙招认甲不招认:甲判刑10年乙当场释放 继续 乙不招认甲也不招认各判刑各判刑5年 4

文档评论(0)

559997799 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档