多面Rasch模型分析软件Facets在英语测试中的应用.pdfVIP

多面Rasch模型分析软件Facets在英语测试中的应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《中国英语教育》2009年第2期,总第24期 EnglishEducationinChina Number2,2009 多面Rasch模型分析软件Facets在英语测试中的应用 1 2 石志亮 ,韩宝成 (1. 中原工学院 外语系,郑州450007,河南 ; 2. 北京外国语大学 中国外语教育研究中心,北京100089) 提要: 提要: 提提要要::本文阐释了多面Rasch 模型的原理,并就其分析软件Facets在国内外英语测试中的研究现状做了 评述;然后,通过实例重点讲述了如何运用Facets软件进行实验设计、编写分析语句、运行程序,以及如 何从考生面、评分者面、评分标准面等对产生的图表进行解读。 关键词: 关键词: 关关键键词词::多面Rasch模型; Facets; 英语测试;应用 中图分类号:H319 文献标识码:A 中图分类号:H319 文献标识码:A 中中图图分分类类号号::HH331199 文文献献标标识识码码::AA 1. Rasch 1. Rasch 11.. 多面RRaasscchh模型的原理 Rasch 模型由丹麦数学家Georg Rasch 于1960 年提出,它是项目反应理论(item response theory, IRT)中最重要的模型。Rasch模型根据被试回答问题的情况,通过对题 目特征函数的运算,来推测被试的能力。Rasch模型超越了以往任何理论,它深入测验的 微观领域,将被试特质水平与被试在项目上的行为关联起来并且将其参数化、模型化, 是通过统计调整控制误差的最好方法;它把项目难度参数与能力参数定义在同一个量 表上,在此模型分析中考生能力与试题参数完全独立;它可以在无样本的情况下对考生的 真分数或能力水平进行估计(Bachman,1999)。另外,通过 Rasch模型测得的被试能力水 平,可以精确估计其测量误差。 自Rasch模型建立以来,许多学者试图将模型改进和推广以适应不同的情形。主要工 作之一就是为模型添加参数(如,难度、区分度和猜测系数等),使模型与数据更加吻合, 其中最为突出的是由芝加哥大学学者John Michael Linacre 于1989 年提出的多面Rasch 模式(many-facet Rasch model)。Rasch模型是双面(被试能力和试题难度)模型,也是单 参数模型,对于项目只考虑难度这一个参数(difficulty index); 若对这一模型进一步拓展, 又考虑到区分度参数(discriminative powder index)时,它就是一个双参数(三面)模型; 三参数(四面)模型则又把猜测系数(guessing index)也作为一个因素加以考虑。双参数 以上的Rasch模型被称为多面Rasch模型。多面Rasch模型继承了Rasch模型的特点并 将此模型扩展到包括更复杂测试条件的研究。多面Rasch模型认为测试结果除受被试能力 和试题难度两个面影响外,还受更多个面,如评分员严厉程度等的影响。在测量分析中实际 设定的面在数量上没有特殊规定,研究者可以根据实际研究的目的确定面的数量。多面模型 主要应用于主观性评价的客观化分析,拓展了IRT理论在测评领域的应用空间。 多面Rasch模型目前广泛应用在心理和教育测量领域,计算机自适应测试(CAT)也 是仰赖IRT的理论与技术。在英语主观测试中,受评分员效应等因素影响,主观评分往往 存在各种不一致性,从而导致主观评分的信度降低。Bachman(1999)认为,测试分数要想 有效,首先必须是可靠的,即测试信度是效度的基础。多面Rasch模型提供的统计框架可 以消除英语主观测试评分中各个方面的因素对于评分结果的影响,从而提高评分结果的信 度。因为多面Rasch模型除了考生能力和试题难度两个面以外,还将评分员以及评分量表 等因素加入了模型,此外还能利用这一模型进行偏差分析,这样它不仅可以分析考生能力和 试题难度不同所导致的差异,而且可以找出由其它因素导致的误差来源,从而为考察评分员 的评分信度提供参考(刘建达,2007)。 2 Rasch 2 Rasch 22.多面RRaasscchh模型的研究现状 目前国内外有关多

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档