- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于信念学习模型的虚拟博弈实验研究
摘要:信念学习模型是博弈论的一个前沿热点问题,当前研究多数 处于初始阶段,国内鲜少有实验验证该模型。文章将教学问答环节进行博 弈化设计,对虚拟博弈信念学习模型进行验证,实验数据分析显示:模型 收敛于均衡策略。实验证明了信念学习模型的有效性,并对今后构建该类 模型提出有益的建议。
关键词:信念学习实验经济学虚拟博弈
屮图分类号:F240文献标识码:A
文章编号:1004-4914 (2016) 09-247-03
一、引言
随着博弈论在各门学科屮的广泛使用,个体行为选择在学习屮的作用 也不断被学者们研究。North (1996)将心理学中个体的认知系统引入到 经济模型中,有效解释了决策中信念及偏好的关系,并将两者融合为理性 决策的基础,由此得出结论:信念是个人行为的准则,它是影响个人行为 选择的重要因素。他人的认知、行动和信念是构建有用模型的先决条件。
随着重复博弈研究的不断加深,经济学家逐步重视学习信念行为,用 以解释当重复整个傅弈时行为往往变得更为理性的原因。随着实验经济学 家对个体在重复博弈中的学习过程进行研究,信念的形成归纳为:口身学 习以及外界互动。自身学习指自身经历不断强化使某种行为发牛的概率上 升,外界互动指通过观察别人行为的收益情况进而指导自身行为决策。在 此基础上,Colin F. Camercr (2003)将信念学习模型定义为:“假设参与 者根据过去的事件来更新他们认为别人会如何行动的信念,从而根据这些 信念来决定哪种策略是最优的。”信念学习模型大致分为三类:信念学习 模型,强化学习模型,经历-加权吸引模型(章平,2006)0
信念学习模型以 Fundenberg and Levine ( 1998 )和 Cheung and Friedman (1997)的虚拟博弈模型为代表,该理论的基础是:参与人通过 观察其他参与人在过去各期内采取的行动概率,由此做出自身预期收益最 大化概率的行为。信念学习模型强调参与者始终牢记其他参与者以前的所 有行动,并且还要求参与者对每一期对手过去的行动赋予相等的权重,以 此来决定自己本轮的行为策略。该模型的观测经历主耍来源于其他参与人 过去的经历,即外界互动。强化学习模型以Bush-Mostcllcr Modle (1997) 为代表,该理论基础是:心理学认为一旦一种行动得到了奖赏,那么个人 在未来继续做出该行动的概率上升。如果是惩罚则未来做出该行动的概率 下降。强化学习模型不强调参与者形成冇关其他参与者可能行动的信念, 因为参与者更关注口己过往行为的奖赏和惩罚,该模型的观测经丿力主要来 源是自身经历,即自身学习。经历-加权吸引模型以Camercr and Teck Ho (1999)的 Experience-Weighted Attraction Modle 为代表,将强化学 习模型和信念学习模型相结合,通过将自身奖惩和观察其他参与者的支付 情况赋予不同的权重,拟合为吸引力指标,参与者对吸引力越敏感采取该 行动的概率越大。
综上,本文通过对教学提问环节进行博弈化设计对信念学习模型进行
研究,检验在重复博弈下该模型是否有效?探讨行为博弈、信念形成及制 度设计方面的相互关系。
二、 理论模型
在序贯二元决策场景的重复博弈下,通常假设对手的行动集合为C (cl, c2???ci???ck),在t轮轉弈之中,参与者对于其他参与者选择行 动ci所赋予的信念权重不断更新为:
bt (ci) =bt-l (ci) +1在t期对手选择行动ci,信念权重相应的增 加lbt-1 (ci)在t期对手选择行动ci,信念权重相应的增加1
则在t期,参与者形成的其对手选择行动ci的概率与信念权重之间 的关系:
卩 t (ci)=
在给定其他参与者选择各种行动的概率的信念下,参与者计算出自己 可供选择的每一个纯策略由(参与者的策略空间为A)的期望支付“ (ai/ ut),则参与者在t+1期选择纯策略ai的概率为:
P 二
同样地,参与者选择具有最大概率值的策略为口己的最优响应。
三、 实验设计和实施
(-)实验设计
实验在教学提问环节进行博弈化设计的背景下,通过多次重复博弈使 本次回答问题的学生在充分了解其他参与者(之前回答问题的学生)的支 付、以及对手(教师)的行动基础上,来决定自己本轮的行为策略。
所谓教学提问环节的博弈化设计是指:将每次课堂提问作为一次博弈 局,博弈的参与者是老师和学生,由于课堂提问内容和教学内容息息相关, 两个参与者都能够充分掌握背景信息,信息对于两者来说是充分的。实验 的行动是教师让学生起来回答问题,教师根据学生的回答质量,依据公开 透明量化的考核标准对学生回答进行打分。该分数作为学生的支付,最终 体现在期末成绩中占有一定权重。为保证博弈的公
您可能关注的文档
最近下载
- 阿联酋航空介绍(共33张PPT).ppt VIP
- 国企纪委书记竞聘面试题笔试题4套和专业题26问及答案.docx VIP
- 现场仪表 温度仪表WEST 8100+温控器说明书.pdf
- 张正友相机标定法课件.pptx VIP
- 某著名企业供应链咨询构建高效协同的销售与采购供应链战略供应链管理(61页PPT).pptx VIP
- 成人肺功能检查技术进展及临床应用推荐指南(2025版)解读.docx VIP
- 中国徐州PPT课件.pptx VIP
- 第1节 温度 (课件)人教版初中物理八年级上册(39页PPT).pptx VIP
- 船舶结构与货运PPT完整全套教学课件.pptx VIP
- 网络与新媒体概论PPT课件3.pptx VIP
文档评论(0)