大学课程《博弈论及其应用》PPT课件:第一章.pptVIP

大学课程《博弈论及其应用》PPT课件:第一章.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 第一章 博弈概述 * 第一节 海滩占位问题 我们来到海滩。夏天很多游客喜欢在在海边晒太阳,游泳。海滩有月牙形,弧形,绵延数公里。为了研究问题方便,我们姑且把海滩的长度抽象定为1,[0,1]区间就表示海滩的长度。 A和B是两个小商贩,出售无差异的补给品,同质同价,同一品牌的矿泉水,面包等。“*”表示游客均匀的分布在海滩上,游客就近购买补给品。在沙滩上应该如何分布两个小商贩的位置呢? * 答案 合理的分布,A在1/4处,B在3/4处,这样对游客,对商贩都是公平合理。两个商贩各拥有一半的客户,收益相同。 两个商贩可不这样想!他们是理性人,理性人的标志是:最大化个人利益。A想增加收益的办法,就是把摊位向中间靠拢,这样可以从B那争取多一些的顾客。B也是理性人,他也会想到这样的办法,将摊位向中间靠拢。这样一来,两个商贩的最后位置就在中间相邻。 * 第二节 猎鹿问题分析 两个猎人A和B约好,一同去猎鹿。一头鹿被他们围在山谷中,刚好山谷中有两个出口可逃,如果每人卡住鹿可能逃跑的这两个关口,齐心协力,就一定能猎到鹿。这时,跑过一群兔子,两个人无论是谁要去抓兔子都会成功。抓到一只兔子的代价是鹿就从他所把守的关口逃跑。 每个猎人可以采取的策略是猎鹿,或者猎兔。 他们必须同时做出选择:猎鹿还是抓兔子。结果会怎样呢? * * 每个猎人从可选择的策略中选一个并实施,构成一个策略组合,对应于每一个策略组合,每个猎人有一个相应的收益,可能的结果有如下四种: A猎鹿,B猎鹿,一定抓得到鹿,每个人的收益是半只鹿; A猎鹿,B猎兔,鹿就从B把守的关口逃掉,A收益零,B收益一只兔子; A猎兔,B猎鹿,鹿就从A把守的关口逃掉,A,收益一只兔子,B收益零; A猎兔,B猎兔,鹿逃掉,A收益一只兔子,B收益一只兔子。 可见,每个猎人的期望,不能由自己决定,要看对方的策略选择,是能够捉得到鹿,依赖对方的选择,如果对方选择捉兔子,而你选择猎鹿,这个策略组合,对你而言,是最差的选择,也是最坏的策略。 第三节 博弈论是什么 博弈论:就是关于包含相互依存情况中理性行为的研究。 博弈的三要素: 博弈方----参与博弈但利益不完全一致者。有二人博弈与多人博弈之分。 策略集----每个博弈方都会有一系列的策略可选,称为对应于每个博弈方的策略集。有限和无限个对策。 得益----在每策略组合下每一博弈方的得益情况,是选择策略的标准,称为得益函数或支付函数。 * 第四节 博弈论的分类 * 第五节 经典博弈模型 一、囚徒困境模型 最著名的策略型博弈之一是“囚徒困境”。它的名字来自嫌疑犯的故事,它的重要性在大量情形中体现,参与者面临着与故事中嫌疑犯面临的同样的动机。 重大案件中的两个嫌疑犯分别被关在两个单身牢房中。有足够的证据证明两个人都犯有较小的罪,但是没有足够的证据证明两人中的任何一个人是主犯,除非至少一个招认,否则警方不能将二人判有罪。警察把二人分别带到不同的房间,告之后果:如果二人均不坦白,将被判入狱一年;如果双方均坦白,将被判入狱5年; 如果一方坦白,另一方不坦白,坦白一方立即释放,另一方判入狱8年。 由理性人的原则,两个嫌疑犯选择策略的原则是最大化个人利益,他们应该如何选择自己的策略? * * 博弈方:两个嫌疑犯A和 B。 策略: 每个嫌疑犯的行动集是(坦白,不坦白)。 收益:对应于每种策略组合,有相应的收益结果。 策略组合:嫌疑犯A和B从可以选择的策略中选择并实施,有四种情况(括号中前面是A的策略,后面是B的策略)。 每个策略组合对应下的A的结果,从优到劣,依次为: (坦白,不坦白),结果是A被释放; (不坦白,不坦白),A被判刑1年; (坦白,坦白),各被判5年; (不坦白,坦白),A被判8年。 同理,每个策略组合对应下的B的结果,从优到劣,依次为: (不坦白,坦白)、(不坦白,不坦白)、(坦白,坦白)、(坦白,不坦白)。 * 军备竞赛可以建模为“囚徒困境”。假设每个国家可以建立核弹军备库,或者采取核军备控制。同时假设每个国家最好的结果是自己拥有核弹头而其他国家没有;其次,是没有一个国家拥有任何核弹;再次之,是两个国家都拥有核弹(要紧的是相对力量,并且核弹的建造很昂贵);最差的结果是其他国家拥有核弹,而你没有。通过“囚徒困境”来建模,其中行动“不造核弹”对应于图1.1中的“不坦白”,而行动“造核弹”对应于该图中的“坦白”。 * * 双寡头削价模型 市场竞争中典型的囚徒困境是双寡头削价模型。通过降价老争夺市场,达到可能的最高利润。这个博弈的结果是双方都选择降价,策略组合(低价,低价)是纳什均衡。 * * 二、零和模型 零和博弈的特点是博弈双方的得益和为零,具有对称性,有赌的意义,台湾至今都把博弈称之赛局。赌胜博弈一般来源于游戏,也是

文档评论(0)

专业写作专家 + 关注
实名认证
服务提供商

人力资源管理师持证人

专注于企业方案、制度、报告、总结、规划编制,PPT制作等

领域认证该用户于2023年09月21日上传了人力资源管理师

1亿VIP精品文档

相关文档