关于博弈学习模型地研究.pdfVIP

  • 8
  • 0
  • 约1.05万字
  • 约 6页
  • 2017-08-16 发布于安徽
  • 举报
第9誊增刊 中国管理科学 Ⅵ.9.昂酊dh吼七 2001年10月01meee 2001 Jeen=ld岫口琴哪tsci㈣oc妇.‘ 文章编号:1003—207(2001)一0090—06 关于博弈学习模型的研究 林元庆,陈加良 (福州大学蕾理学院,福建福州350002) 摘要:有限理性参与者之间的博弃同题是人们十分关注的研究项目。目前已提出了一些博彝学习模 盈.但都存在一定的局限性。本文给出了博弈学习的一十改进方法,建立了新的博彝学习模型。仿真实 验表明,新的博弈学习方法的实用性和有救性有了很大的提高。 关鬟词:有限理性的博奔问题;博弃学习棋型;仿真实验 中圈分类号:C931 文献标识码:^ 1博弈学习理论的提出 纳什均衡概念是现代博弈论的基础和核心,基于纳什均衡定义建立起来的纳什均衡分析方法 获得了广泛的应用,成为现代决策分析的有力工具。在纳什均衡论取得极大成功的时候,人们开始 思考纳什均衡概念的基本假设的合理性问题。纳什均衡概念中,假设每个参与者都拥有对其它参 与者行动的正确预期,并且能理性地行动,也就是说纳什均衡的基本假设是;参与者不但具有追求 自身最大利益的行为理性,也拥有关于博弈结构以及其它参与者的策略和得益的知识理性。纳什 均衡概念中博弈参与者是完全理性的。 博弈论的前提是将参与者看作是完全理性的参与者,但从现实上考虑。这一前提常常不会得到 满足。尤其是关于知识理性的假设是难以实现的。在这样的背景下,一些学者提出了博弈学习理 论.这种理论认为博弈的参与者只具有有限的理性,即假设参与者具有行动的理性,但缺乏知识的 理性。所谓行动的理性,是指参与者具有优化自己得益的能力,能够采取最大化自己得益的理性行 动;而知识理性的缺乏则意味着,某参与者所知道或了解的东西,其它参与者可能不知道。在这种 假设下,决策者只能在无法拥有对其它参与者行动的一致预期的条件下选择自己的行动,这样,传 统的纳什均衡分析方法已经无法使用了。博弈学习理论克服了这一困难,发展出一个由认知能力 的学习机制所支持的策略行动的动态演化理论,并探求这种策略学习过程的演化结果鼹完全理性 条件下纳什均衡的同一性问题,从而解决了有限理性条件下博弈的求解问题。 博弈学习理论是博弈论的前沿研究课题.已引起国内外学者的重视,本文将评述目前已提出的 一些博弈学习模型.指出它们所存在的缺陷,在这个基础上,笔者提出了博弈学习的一十改进方法, 建立了相应的博弈学习模型,取得了一些新的研究结果。 啦■日■:2∞l一町一16 ‘垒曩售:国赢自然种学基盒费助嘎目(7007;005) 作誊■舟.林元庆(19,5一).男(救族).枉t福州市人.福州太学f理学嚏.教授.研究方内:博彝论与最井f理 增刊 林元庆等:关于博弈学习模型的研究 2最优反应动态模型 在博弈的学习理论中,最优反应动态模型是最早提出来的学习模型,我们以寡头垄断市场中古 诺竞争问题为倒作简要的分析。 两个厂商的产量记为龟,啦.其产品的市场价格函数为:P=a—b(qI+q),假设两个厂商的成 本函数均为一个二次型的函数:c(q)=一寸+鼬+r,如此两个厂商的利润函数为: 砒(乳,92)=q.(口一蛔。一‰)+删i一自-一r (1) E2(q..q2)=口2(口一69。一幻:)+《一触一r (2) 假设厂商是行动理性的,它具有优化自己利润的计算能力.即可求得: 垫娑型=4—2‰一‰+2m/-一卢=o (3) 垫掣=d一幻,一2幻2+2aq:一卢=o (4) 进而确定各自的最舨应函数: g,=一志g:+耥

文档评论(0)

1亿VIP精品文档

相关文档