- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维普资讯
第29卷 第 1期 西 华 师 范 大 学 学 报 (自然 科 学 版 ) 2008年 3月
V01.29 No.1 JournalofChinaWestNormalUniversity(NaturalSciences) Mar.2008
文章编号:1673-5072(2008)0l-084-05
项 目反应理论及其在计算机 自适应测试中的应用
高怀勇 , 金桂林
(1.四川农业大学外语 系,四川 雅安 625014: 2.西南交通大学外语学院,四川 成都 610061)
摘 要:项目反应理论IRT(ItemResponseTheory)以强假设为基础,具有经典测试理论(crr)所没有的众多优点,
是计算机 自适应测试的新突破.本文介绍了IRT的特点,以及基于 IRT的计算机 自适应测试 (ComputerAdaptive
Test)工作原理、需要解决的难题以及相关设计原理.
关键词:项 目反应理论;计算机自适应测试;经典测试理论
中图分类号 :TP391 文献标识码 :B
1 IRT背景及其假设
项 目反应理论(IRT)最早始于上世纪30年代末和40年代初.早在 1946年 Tucker就提出:被试对 1个
测试项 目的正确反应概率与该测试所对应的能力水平是 1条二维曲线,即项 目特征 曲线 (icc).Rasch在
1960年提出了他著名的单参数模型拉希模型,之后他的学生Wright将拉希模型应用推广,并于 1964年推出
IRT发展史上第 1个实用参数估计程序BICAL.1974年劳德提出了著名的参数估计程序逻辑斯蒂(Logist),
将三参数模型的理论应用到CAT .项 目反应理论(IRT)以四大强假设为基础 :(1)测试的潜在能力(1atent
trait)单维性,即IRT测试的仅是被试的 1种能力.事实上 IRT并不是严格意义上的单维性 ,它所要求的单维
性是指所有影响被试反应的因素中只有 1个因子 占主导地位,该因素即是测试所要测试的能力 ;(2)测试项
目局部独立性,即试题项目参数的估计独立于被试样本.也就是说,IRT中的这些参数具有不变性,它们不随
被试的样本而变化 ;(3)同一项 目的特征函数曲线 (ICC)参数唯一性,即同一个测试项 目,高能力和低能力被
试的反应拟合同一条项 目特征函数曲线.同一条 ICC所对应的项 目参数是唯一的 ;(4)非限时(unspeed
ness)性,即 IRT要求测试是在不限时的条件下进行的,如被试对某些项 目未作反应,则可认为是他的能力不
足.
2 IRT特点
与经典测试理论(CTT)相比,IRT在理论和方法上有许多明显的优点:(1)采用非线性模型,建立了被试
对项 目的反应(即observedscore)与其潜在特质(即ability)之间的非线性关系.(2)能力参数估计P(0)的不
变性和一致性 ,即对被试能力的估计不依赖于特定的测试题 目.IRT用同一量尺来估计被试能力和测试题 目
难度 ,无论测试的难易,被试能力估计值不变 .它们的特征函数如下 :单参数模式特征函数 :P()=l/(1+
e D‘ ’);双参数模式特征函数 :P(0)=1/(1+e’D ”);三参数模式特征 函数:P(0):c+(1一c)/(1+
eD‘ ”).其中:D=1.702,为一常数;为被试能力值(其值有正负之分,一般取值:一404;a为题 目的
区分度 ,即特征曲线的斜率,它的值越大说明题 目对受测者的区分程度越高;b为题 目的难度 ,即特征曲线在
横坐标轴上的投影;C为题 目的猜测系数,即特征曲线的截距,其值越大,说明不论受测者能力高低,都容易
猜对本道题 目.P(0)指能力为 0的人答对此题 目的概率,其数值介于 0与 1之间.一般题 目的P值建议以
0.2—0.8为宜 ].(3)IRT还提供了能力估计量精度水平的客观指标 :测试信息函数.用测试所提供的能力
收稿 日期 :2007—09—02
基金项 目:四川省科技厅重点项 目(o4jyO29—100)
作者简介 :高怀勇(1975一),男 ,四川雅安人,四川农业大学外语系讲师 ,硕士.主要从事语 言测试及其应用语 言学方面的
研究工作.
文档评论(0)