一次性n人英烈人的叛逆愿度.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一次性n人英烈人的叛逆愿度 0 内外合作与方域博弈 自1950年唐克教授为心理学杂志开设了一个例子以来,他在赌博和经济方面产生了深远的影响。中心问题是“囚徒”们如何走出困境问题的研究,大部分都是关于重复博弈的,例如文献如,也有一些一次性博弈的,例如文献。在n人囚徒困境中,每个参与人(“囚徒”)都恰有两个纯策略——合作与背叛,因此这种博弈是n人双行动博弈,姜殿玉()专门研究了双行动n人博弈的局势分析问题。本文试图研究在一种惩罚机制下,一次性n人囚徒困境的背叛与合作行为。研究表明,“囚徒”愿意合作的程度与背叛惩罚机制与博弈的参数有关,用所得到的结论研究文献中大量出现的囚徒困境问题,其结论是非常合理的。 1 .各参与人的博弈模型 定义1n人囚徒困境定义为Γ≡[N,(Ai),(ui)],其中N={1,2,…n}是参与人的集合,Ai={Di,Ci}是参与人i的纯策略集合,其中Di和Ci分别是参与人i的策略——背叛和合作, 记a=an…a1∈A=∏i∈NAi,a-1=an…ai+1ai-1…a1∈A-1=∏j∈Ni}Aj,当参与人i使用Di和Ci时,他的赢得效用分别为 ui(a?i,Di)={δia?i≠D?iβia?i=D?i?ui(a?i,Ci)={αia?i≠C?iγia?i=C?i?αiβiγiδi??i∈Nui(a-i,Di)={δia-i≠D-iβia-i=D-i?ui(a-i,Ci)={αia-i≠C-iγia-i=C-i?αiβiγiδi??i∈Ν 这个博弈模型解释为,当全体参与人都选择背叛时,参与人i的利益是βi;当全体参与人都选择合作时,参与人i的利益是γi;当既有背叛的,又有合作的时,背叛的参与人i得到最好的利益δi,合作的参与人j得到最坏的利益αj。特别当 n=2,δ1=δ2=0,γ1=γ2=-γ,β1=β2=-β,α1=α2=-α,0γβα 时,就成为文献中经常出现的(2人)囚徒困境的一般情形。 定理1对于n人囚徒困境,我们有ui(a-i,Di)ui(a-i,Ci),?i∈N,?a-i∈A-i。 证明情况1:当a-i=D-i时,有 ui(a-i,Di)=ui(D-i,Di)=βiαi=ui(D-i,Ci)=ui(a-i,Ci) 情况2:当a-i≠C-i、D-i时,有 ui(a-i,Di)=δiαi=ui(a-i,Di) 情况3:当a-i=C-i时,有 ui(a-i,Di)=ui(C-i,Di)=δiγi=ui(C-i,Ci)=ui(a-i,Ci) 定理1 说明,对于任意参与人,无论其他参与人使用什么策略,他使用背叛策略Di都优于使用合作策略Ci。因此从个体利益出发,全体参与人必然都使用背叛策略Di。此时,参与人i的赢得是βi。但是如果大家都使用合作策略Ci,则每个参与人i的赢得为γiβi。这说明合作优于各顾各。 2 违背惩罚函数的定义 当仅有参与人i背叛时,他由背叛所得到的利益为ui(C-i,Di)-ui(C-i,Ci)=δi-γi,其他参与人j(j≠i)的损失为 |uj(C1…Ci-1DiCi+1…Cj…Cn)-uj(C-j,Cj)|=|αj-γj|=γj-αj 定义2P=kx(k≥0,x0)称为背叛惩罚函数,意为给参与人j造成的损失由背叛者承担k(γj-αj),其中k称为(对背叛者的)惩罚力度。 由于不可能背叛者给某个非背叛者造成的损失越大,他受到的惩罚就越小,所以k≥0。 3 有被违者的矛盾行为的参与人i 当i所获得的利益可以赔偿全体不背叛的参与人时,有δi-γi≥k∑j∈Ni}(γj-αj)。此时参与人i有积极性背叛,且右端越小或者左边越大,积极性越高。 当参与人i的获利不能赔偿全体不背叛的参与人时,有δi-γik∑j∈Ni}(γj-αj)。此时参与人i没有积极性背叛,且右端越小或者左边越大,不背叛的积极性越高。 定义3Di(k)=1-k∑j∈Ni}(γj-αj)/(δi-γi)表示参与人i背叛的积极性的大小,称为参与人i的背叛愿意度。 定理2当0≤Di(k)≤1时,参与人i愿意背叛,且Di(k)越大,参与人i的愿意背叛的程度越大。特别,当Di(k)=0时,参与人i是否背叛结果一样。当Di(k)0时,-Di(k)越大,参与人i的合作的积极性就越大。 定理3计算每个参与人的背叛度。如果至少有一个参与人愿意背叛,那么大家都背叛;如果全体参与人都愿意合作,则合作成功。 为使大家都不背叛,公共背叛惩罚力度k一般尽量设计得足够大。例如,(1)在战场上,长官遇到逃兵则就地正法。(2)k可以表示社会道德水平(自律意识),例如社会道德水平较高的人都会自动排队买票——加塞会受到道德的谴责;否则将陷入囚徒困境——大家买票都困难。(3)k可表示江湖上的义气程度或江湖帮规等约束机制。 特别当k=0时,Di(k)=1。说明当无惩

文档评论(0)

uyyyeuuryw + 关注
实名认证
文档贡献者

专业文档制作

1亿VIP精品文档

相关文档