- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于博弈论的竞赛学习对学生学习动机影响研究*
肖达信
摘 要:本文从经典的博弈理论出发,运用“合作与竞争”的思想解决存在矛盾与冲突的问题,设计“矩阵游戏”与“竞猜硬币”的竞赛学习模型,并进行实验研究,分析学习者在学习模式中最优策略的选择,探讨竞赛学习对学生学习动机的影响。结果显示,竞赛学习模式激发学生学习动机,提高自身竞争力,改善学习绩效。
关键词:竞赛学习,博弈论,合作,竞争,学习动机
博弈论,又名对策论(英文是Game Theory),是应用数学的一个分支,其研究具有斗争或竞争性质行为(即博弈行为)的数学理论和方法[1]。在这类行为中,参加斗争或竞争的各方具有不同的目标或利益为了达到各自的目标和利益,各方必须考虑对手的各种可能,并力图选取对自己最为有利或最为合理的方案。博弈论思想古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著
竞赛学习是通过竞赛或竞争的形式习得知识的学习模式,是基于游戏学习的一种。竞赛学习策略结合协作学习,基于项目、问题、游戏的学习等理论,激发学生的学习动机,改善学习绩效。本文利用博弈论的思想设计竞赛学习策略,将其与计算机程序设计课程的学习相结合,对比学生不同时期的学习反馈与效果,探讨“竞赛学习”这一具有游戏特性和教育意义的学习模式对学生学习动机的影响。
一、“囚徒困境”与“重复博弈”
博弈行为通常由个人、团队或组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后、一次或多次从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程[2]。利用博弈行为中的合作博弈与非合作博弈分析竞赛学习中尤为凸显的协作与竞争,探究策略选择问题。
“囚徒困境”是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择,是典型的非合作博弈模型,囚徒困境的主旨为,警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。若二人都互相检举(互相“背叛”),则二人同样判监2年[3]。如图1所示,囚徒们虽然彼此坚不吐实,可为全体带来最佳利益,但因为出卖同伙可为自己带来利益,也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。因此在“囚徒困境“一次性的博弈中,双方都选择背叛是一个纳什均衡, 但显然不是顾及团体利益的解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判监均比合作为高,总体利益较合作为低,这就是“困境”所在。
B 合作 B 背叛 A 合作 -1, -1 -10, 0 A 背叛 0, -10 -8,-8 图1 “囚徒困境”博弈
“囚徒困境”的博弈次数只为一次,博弈双方并不选择合作而选择彼此认为利益最大的背叛,但当“囚徒困境”扩展为多人博弈时,共有的资源是有限的,当每个人都试图从有限的资源中多拿一点儿时,就产生了局部利益与整体利益的冲突。他要求每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两博弈,以找出什么样的策略得分最高。什么时候结束游戏是未知的
第一次比赛时共有15个策略(程序)参加,艾克斯罗德将每一策略分别和所有策略对弈,运转200步,结果得分最高的程序是加拿大学者罗伯布一报还一报(tit for tat)),该程序第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。
为了进一步验证上述结论,艾氏决定邀请更多的人再做一次游戏,并把第一次的结果公开发表。第二次征集到了62个程序,加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是一报还一报。艾氏总结这次游戏的结论是:一报还一报仍是最优策略[4]。
反复地进行中,每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
二、关于游戏学习动机的研究
学习动机是影响学习的重要内部因素,是教育理论和心理学研究的一个重要主题。学习动机是指个体由一种学习目标或对象引导、激发和维持学习活动的内在心理过程或内部动力。来自于17173的2007年“第七届中国网络游戏市场调查报告”数据显示,30%的游戏玩家玩游戏的
原创力文档


文档评论(0)