- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1、博弈
2、复杂网络上的演化博弈
2.1、网络演化博弈的策略更新规则
2.2、网络拓扑对合作的影响
2.3、记忆对网络博弈中的影响
24、博弈动力学与网络拓扑共演化
2.5、学习机制导致合作的涌现
3、展望
一个个性和另一个个性的联结
对被联结的个性的命运具有多大的意义?
你要知道,这是一生的事情,
在我们的背后隐藏着无数的枝节。
陀思妥耶夫斯基,《白痴》第501页
个游戏:两人轮流向圆桌上放一元硬币
谁无法再在圆桌上放硬币则判负,另一方获胜,
假设所有的硬币不允许重叠。你会先放还是后放,
以何种策略确保自己获胜?
博弈研究的对象是游戏(Game),更确切的说
是指在具有双方相互竞争对立的环境条件下
参与者依靠所掌握的信息,在一定的规则约束下
各自选择策略并取得相应结果(或收益)的过程
博弈论就是使用数学模型硏究冲突对抗条件下最优决策
问题的理论。
博弈论
博弈论被认为是研究自然和人类社会中普遍存在的合作行为
最为有力的手段。
博弈模型反映了自私的个体之间的合作竟争关系,能够
很好地刻画生物系统中生物体之间的相互作用关系及演
化动力学。
不论在自然或是社会系统中,经典博弈论告诉我们自私个体
博弈的结果必然是背叛。显然是一个和实际情况不完全吻合
结论。社会经济活动中的绝大多数任务不可能由单人完成,
需要群体的分工和合作。
问题:为什么自私的个体组成的群体会产生合作行为
存在什么样的机制,以及什么样的条件才会有合作行为涌现?
通常博弈由以下4个部分所组成
(1博弈个体:在一个博弈中至少有两位决策者( agent)参与博弈
2)策略集:个体的博弈策略可以是纯策略,也可以是混合策略
博弈的策略集由参与博弈的个体所有可能采用的策略所组成.
(3)收益矩阵:当博弈个体选定好自己的策略后,其所获取的收
益由收益矩阵中的相应元素来确定.
(4)策略演化:在多轮博弈过程中,博弈个体遵循自身收益最大
化的最终目标,即以此目标为指导原则来进行策略调整。
纳什均衡
真实生活中的博弈问题是很复杂的,可能会有很多的
参与者,每个参与者都有不同的策略。当参与者们在
进行项博弈的时候,他们应该选择什么样的策略?
是否有办法预言出他们的策略组合(s1,s2,…,sN)?
纳什(Nash)均衡:其核心思想是对于两人或多人博弈
个体的策略演化会趋向于—个均衡态,在此均衡态下所
有的个体会同时采取“纳什均衡策略
Nash认为,博弈问题的解应该是这样的一组策略,在这组
策略中,每一个参与者都无法通过单独改变自己的策略而
获得更多的收益。这样的状态就被称作纳什均衡态,
实际上纳什均衡态对所有的参与者来说,不一定是最好的结局。
经典博弈模型
下面以囚徒困境博弈和雪堆博弈为例来阐述纳什均衡
囚徒困境博弈:
两个小偷A和B合伙作案,被捕后被隔离审讯.如果双方都拒
绝坦白同伴的罪行,两人将会被轻判1年徒刑为此,警方设
计了一个机制:如果A揭发B的罪行,B拒不供认A的罪行,则
A将无罪释放,而B将被重判5年徒刑如果A、B都揭发对方
罪行,则双方均被判刑3年.
在此情况下,自私的个体应如何做出抉择?
合作( Cooperate-C)or背叛 defect-D)
对于两人博弈,收益矩阵元通常用(R、S、T、P)来表示
T P
相互合作则二人同获得较大收益R,相互背叛则同获较小
收益P,一方合作一方背叛,则背叛者获得最高收益T,
而合作者获得最低收益S,即参数满足关系:TRPS,
此外2R+S,即相互合作能获得集体最高收益.
不论对手采取哪种策略,选择背叛策略都是最佳的,即理
性的个体最终会处于相互背叛的状态(注意到此时的集体收
益低于两人同时选择合作时的情况,这种相互背叛的状态
①D,D就是系统的纳什均衡态。
雪堆博弈
在一个风雪交加的夜晚,两人开车相向而行,被一个雪
堆所阻,如图所示白色和灰色分别表示合作策略与背叛
策略与囚徒困境博弈不同,对于雪堆博弈,收益矩阵元
满足关系:TRSP
a)雪堆博弃的小意图
(b)进行雪堆博弈时,个体所得收益示意图
假设铲除这个雪堆使道路通畅需要付出的劳动量为
道路通畅则带给每个人的好处量化为b(c)。
如果两人一齐动手铲雪,则他们的收益为R=bc/2(分别承担
劳动量c/2):如果只有一人下车铲雪,虽然两人都能及时回家
,但是背叛者逃避了劳动,它的收益为T=b,而合作者的收
益为S=b-c:如果两人都选择不合作,则两人都无法及时回家
其收益量化为P=0雪堆模型的收益矩阵可表示为
b-s b-c
b 0
那么,理性个体的最优选择是什么呢?
您可能关注的文档
最近下载
- 2024山东省烟草专卖局招聘42人及高频考题难、易错点模拟试题(共500题)附带答案详解.docx
- 组织生活会自我剖析材料.docx VIP
- 一年级语文:我妈妈.docx VIP
- 市政通用进度计划保证措施[共11页].docx VIP
- 人教新起点小学英语二年级下册 unit weather.pptx VIP
- 河南省 12YJ9-1 《室外工程》建筑标准.docx VIP
- 2025年苏州健雄职业技术学院单招面试题库及答案解析.docx
- 网络与信息安全管理员(四级)考试题库附答案.docx VIP
- 物业保安部增加人员申请报告.pptx
- 培智学校人教版信息技术四年级《第一单元 我是小画家(1)》大单元整体教学设计[2022课标].docx
文档评论(0)