多面Rasch模型分析软件Facets在英语测试中的应用.pdfVIP

下载本文档

80
0
约 10页
2017-09-16 发布于重庆
举报
版权申诉

多面Rasch模型分析软件Facets在英语测试中的应用.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

《中国英语教育》2009年第2期，总第24期 EnglishEducationinChina Number2,2009 多面Rasch模型分析软件Facets在英语测试中的应用 1 2 石志亮，韩宝成（1. 中原工学院外语系，郑州450007，河南； 2. 北京外国语大学中国外语教育研究中心，北京100089）提要：提要：提提要要：：本文阐释了多面Rasch 模型的原理，并就其分析软件Facets在国内外英语测试中的研究现状做了评述；然后，通过实例重点讲述了如何运用Facets软件进行实验设计、编写分析语句、运行程序，以及如何从考生面、评分者面、评分标准面等对产生的图表进行解读。关键词：关键词：关关键键词词：：多面Rasch模型; Facets; 英语测试；应用中图分类号：H319 文献标识码：A 中图分类号：H319 文献标识码：A 中中图图分分类类号号：：HH331199 文文献献标标识识码码：：AA 1. Rasch 1. Rasch 11.. 多面RRaasscchh模型的原理 Rasch 模型由丹麦数学家Georg Rasch 于1960 年提出，它是项目反应理论（item response theory, IRT）中最重要的模型。Rasch模型根据被试回答问题的情况，通过对题目特征函数的运算，来推测被试的能力。Rasch模型超越了以往任何理论，它深入测验的微观领域，将被试特质水平与被试在项目上的行为关联起来并且将其参数化、模型化，是通过统计调整控制误差的最好方法；它把项目难度参数与能力参数定义在同一个量表上，在此模型分析中考生能力与试题参数完全独立；它可以在无样本的情况下对考生的真分数或能力水平进行估计(Bachman,1999)。另外，通过 Rasch模型测得的被试能力水平，可以精确估计其测量误差。自Rasch模型建立以来，许多学者试图将模型改进和推广以适应不同的情形。主要工作之一就是为模型添加参数（如，难度、区分度和猜测系数等），使模型与数据更加吻合，其中最为突出的是由芝加哥大学学者John Michael Linacre 于1989 年提出的多面Rasch 模式(many-facet Rasch model)。Rasch模型是双面（被试能力和试题难度）模型，也是单参数模型，对于项目只考虑难度这一个参数（difficulty index）；若对这一模型进一步拓展，又考虑到区分度参数（discriminative powder index）时，它就是一个双参数（三面）模型；三参数（四面）模型则又把猜测系数（guessing index）也作为一个因素加以考虑。双参数以上的Rasch模型被称为多面Rasch模型。多面Rasch模型继承了Rasch模型的特点并将此模型扩展到包括更复杂测试条件的研究。多面Rasch模型认为测试结果除受被试能力和试题难度两个面影响外，还受更多个面，如评分员严厉程度等的影响。在测量分析中实际设定的面在数量上没有特殊规定，研究者可以根据实际研究的目的确定面的数量。多面模型主要应用于主观性评价的客观化分析，拓展了IRT理论在测评领域的应用空间。多面Rasch模型目前广泛应用在心理和教育测量领域，计算机自适应测试（CAT）也是仰赖IRT的理论与技术。在英语主观测试中，受评分员效应等因素影响，主观评分往往存在各种不一致性，从而导致主观评分的信度降低。Bachman(1999)认为，测试分数要想有效，首先必须是可靠的，即测试信度是效度的基础。多面Rasch模型提供的统计框架可以消除英语主观测试评分中各个方面的因素对于评分结果的影响，从而提高评分结果的信度。因为多面Rasch模型除了考生能力和试题难度两个面以外，还将评分员以及评分量表等因素加入了模型，此外还能利用这一模型进行偏差分析，这样它不仅可以分析考生能力和试题难度不同所导致的差异，而且可以找出由其它因素导致的误差来源，从而为考察评分员的评分信度提供参考(刘建达，2007)。 2 Rasch 2 Rasch 22．多面RRaasscchh模型的研究现状目前国内外有关多