决策理论7

第七章 竞争型决策分析 博弈论(game theory)是由美国数学家冯·诺依曼(Von. Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。 博弈论是一门十分有趣但理论上又是十分艰深的学问,我今天打算用一些大家能够凭直观或简单分析就能把握的例子为同学们介绍博弈论的基本概念及应用。 “要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解” ——保罗·萨缪尔森 什么是博弈论?  博弈论是研究理性的决策者之间的冲突与合作的理论,具体讲就是研究当决策主体的行为在发生直接的相互作用时,人们如何进行决策以及这种决策的均衡问题。 什么是博弈?  博弈是指代表不同利益主体的决策者,在一定的环境条件和规则下,根据所掌握的信息,同时或先后、一次或多次从各自允许选择的行动方案中加以选择并实施,从而取得各自相应结果的过程。 田忌赛马-续篇 古代齐威王与大将田忌赛马,田忌的谋士孙膑运用计谋帮助田忌以弱胜强。 比赛规则:田忌与齐威王各出三匹马,一对一比赛三场,每一场的输方要赔1千金给赢方。双方的马按实力都可以分为上、中、下,但齐威王的上、中、下均优于田忌的上、中、下。实际上,田忌的上马、中马要优于齐威王的中马、下马。 比赛结果:田忌连输三场;后孙膑建议,以上对中、以中对下、以下对上,结果以2:1赢得比赛。 田忌赛马-续篇 这个案例生动地告诉我们,巧妙地运用策略是多么的重要。 但是,事情并没有结束,齐威王也很聪明,他利用各种手段,很快明白了自己输掉比赛的原因而及时地调整了自己的对策。这样,齐威王与田忌的赛马也就成了一个具有策略依存特征的决策较量,构成了一个典型的博弈问题 如果把赢一千金记成收益1,输一千金记成收益为-1,则齐威王和田忌在各种策略组合下的收益如下表所示: 田忌赛马-续篇 在上述混合策略下,齐威王的期望得益为1/6(3+1+1+1+1-1)=1;田忌的期望得益为1/6(1-3-1-1-1-1)=-1,即多次进行这样的赛马,齐威王平均每次能赢田忌1千金,这是因为齐威王三匹马的总体实力略胜田忌三匹马总体实力的缘故 博弈的要素 1、参与人:  是指博弈中独立决策、独立承担结果的决策主体。他们可以是自然人或团体或法人,如企业、国家、地区、社团、欧盟、北约等。 那些不作决策或虽做决策但不直接承担决策后果的被动主体不是参与人,而只能当做环境参数来处理。如指手划脚的看牌人、看棋人,企业的顾问等。 博弈的要素 2、策略  指每个博弈方在进行决策时可以选择的方法、做法等,策略有纯策略和混合策略之分。  纯策略指参与人在博弈中可以选择采用的行动方案,  混合策略是在纯策略空间上的一种概率分布,表示参与人实际进行决策时根据这种概率分布在纯策略中随机选择加以实施。 博弈的要素 3、支付:  每个博弈方从各种策略组合中获得的收益或效用,它是策略组合的函数,所以也称支付函数记为ui(s)。 ui(s)= ui(s1, s2 … ,si ,… sn-1 , sn). 博弈的要素 4、博弈方的信息 信息是博弈参与方有关其他博弈方的策略、收益等知识。 5、博弈的次序 规定一个博弈就必须规定其次序,不同的次序是不同的博弈。 6、结果和均衡 结果指博弈中博弈方的行动所产生的每一可能情形。 博弈的分类 一、按参与方数目: 1、单人博弈 2、两人博弈 3、多人博弈 博弈的分类 二、按各博弈方可选策略数量的多少 1、有限博弈 2、无限博弈 博弈的分类 三、按参加博弈的各个博弈方从博弈中所获得的利益总和 1、零和博弈 2、常和博弈 3、变和博弈 博弈的分类 四、按参与人行动的先后顺序 1、静态博弈 2、动态博弈 博弈的分类 五、按参与人所掌握的信息 1、完全信息博弈 2、不完全信息博弈 博弈的分类-综合划分 第二节 完全信息静态博弈 一、占优战略均衡 二、重复剔除的占优战略均衡 三、纳什均衡 一、占优战略均衡  不论其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”(dominant strategies)。  占优战略均衡只要求所有的参与人是理性的,而并不要求每个参与人知道其他参与人也是理性的。因为,不论其他参与人是否理性,占优战略总是一个理性参与人的最优选择。 一、从“囚徒困境”谈起 1. 囚徒困境 两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,

文档评论(0)

1亿VIP精品文档

相关文档