计算机辅助评价的发展趋势 - 中国教育技术学 - powered by 教客.docxVIP

计算机辅助评价的发展趋势 - 中国教育技术学 - powered by 教客.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机辅助评价的发展趋势 - 中国教育技术学 - powered by 教客 计算机辅助评价的发展趋势 - 中国教育技术学 - powered by 教客 计算机辅助评价(Computer Assisted Assessment)是一个范围很广的概念,它涵盖了计算机在个人知识、技能和能力评价领域中应用的诸多方面。由于目前计算机技术、网络技术等信息技术迅速发展,大型的社会化考试(比如职业资格认证、TOFEL、GRE等)以及远程教育和网络教育中教学评价活动的开展对计算机辅助评价的需求也日益扩大,因此计算机辅助评价的研究和应用出现了一些新的发展信息。从目前CAA的研究情况来看,测量理论尤其是项目反应理论及其实现技术、计算机辅助形成性教学评价、基于网络的计算机辅助测试、通过计算机辅助记录学习过程信息实现评价等领域都将是计算机辅助评价的重要发展方向。 一、计算机辅助测试的优势 随着科学技术特别是信息技术的发展,我们正在向终身学习社会迈进,人们不但可以接受基础教育和高等教育,而且可以接受职业教育和社会培训等多种教育,受教育的机会和时间将越来越多,传统的教育评价方法和测试手段也越来越不适应教育发展的需要。特别是在以下情形,传统的测试方法已很难适应: 1. 被试数目过大。 2. 测试和评价的周期很短。 3. 实施测试和评价的人员或资金紧张。 4. 被试有时间上的压力或冲突;或者在地理位置上很分散。 因此,计算机辅助测试显得越来越重要,因而成了教育评价发展的一个重要趋势。 计算机辅助测试是计算机辅助评价研究和应用的主要形式,这不仅因为评价的主要手段是测试,而且因为计算机辅助测试本身所具备的特点而使得它在教育评价、职业测量、人事测评等领域中大显身手。 概括来说,计算机辅助测试的主要特点有以下三个方面: 1. 高效率:可以胜任大范围群体的测试,以电子方式发布和传输测试材料,反馈及时、测试结果的分析报告专业、查卷工作简单高效,考试服务人员数目减少,组织工作相对简单。 2. 测量方法可以更复杂、更准确,有利于更有效地测量被试的知识和能力水平。 3. 测试时间和地点具备一定自由性,不再严格要求到同时和同地。 二、项目反应理论代表了测试理论和实践的发展方向 测试的指导理论主要有两种:经典测试理论与项目反应理论。 经典测试理论(Classical Test Theory,缩写为CTT)是从20世纪初发展起来的,它的基本思想是:对某个学生进行测验所得分数X可看作是代表该生实际知识或能力水平的真实分数( )和测验误差分数( )的线性组合,即:X= + 。 经过近百年的发展,经典测试理论建立了一系列整个测验质量和单个项目(题目)分析的公式。比如分析整个测验的质量时,估计信度系数的公式有库德──理查逊(Kuder—Richardson)公式和克伦巴赫(Cronbach)公式,分析单个项目时有难度、区分度、迷惑效力的计算公式等。另外,经典测试理论对于各种测验的编制、考分的转换与等值等均有一套较为完整的方法,但是此理论仍存在着无法克服的问题:首先,测验参数(如难度和区分度)过分依赖测验的考生样本;其次,测验结果的可比性差,只有当所有被试都实施相同的测验项目或其平行复本时测验结果才是可比的。 针对经典测试理论的不足,50年代以后逐渐提出了一些新的测试理论。其中项目反应理论(Item Response Theory,缩写为IRT)较为突出,影响较大。与经典测试理论采用的线性模型不同,项目反应理论采用的是非线性概率模型。 IRT认为,被试对测验的反应受某种心理特质支配,测验的结果和这种特质之间所存在的关系可用“项目特性曲线”来描述。在IRT研究的过程中,人们提出了多种项目特征曲线的数学函数,目前应用较广的是伯恩鲍姆于1975年提出的单维逻辑斯蒂型。简单描述单维逻辑斯蒂型的“项目特性曲线”可以用 =F(Q,a,b,c)来表述。其中Q表示被试的能力特质,a、b、c标识项目的质量参数,分别是区分度参数、难度参数和猜测参数, 表示被试关于第j题的正确反应概率。项目的质量参数值都不能由直接测量得到,必须通过对被试的反应数据进行估计来求出,通常采用的是极大似然估计法。 项目反应理论对于测量误差的处理是通过信息函数加以实现的。就某个试题j而言,其质量指标a、b、c是一定的,信息函数值只与被试能力素质水平有关,它的大小直接反映出该题对被试能力特质的估计精度,信息函数值越大,这种估计就越精确。信息函数的引入,提供了测验精度的确定信息,从而可以针对各水平上的能力特质更好地控制测量误差。 项目反应理论虽然克服了经典测试理论的

文档评论(0)

180****8756 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体盛世风云(深圳)网络科技有限公司
IP属地陕西
统一社会信用代码/组织机构代码
91440300069269024M

1亿VIP精品文档

相关文档