复杂决策规则下MIRT的分类准确性和分类一致性-心理学报.PDF

下载文档 降价啦

2
0
约6.51万字
约 13页
2017-08-29 发布于天津
举报
版权申诉
保障服务

复杂决策规则下MIRT的分类准确性和分类一致性-心理学报.PDF

1、本文档共13页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

复杂决策规则下MIRT的分类准确性和分类一致性-心理学报

心理学报 2016, Vol. 48, No.12, 16121624 Acta Psychologica Sinica DOI: 10.3724/SP.J.1041.2016.0 1612 复杂决策规则下MIRT 的分类准确性和分类一致性* 1 2 1 汪文义宋丽红丁树良 (1 江西师范大学计算机信息工程学院; 2 江西师范大学初等教育学院, 南昌 330022) 摘要介绍多维项目反应理论模型下分类准确性和分类一致性指标 , 采用蒙特卡罗方法实现复杂决策规则下指标计算 , 并从数学上证明分类准确性指标两类估计量在均匀先验和相同决策规则条件下依概率收敛于同一真值。研究结果表明：分类准确性指标可以比较准确地评价分类结果的准确性; 分类一致性指标可以较好地评价分类结果的重测一致性 ; 在一定条件下 , 基于能力量尺的指标优于基于原始总分的指标 ; 纵使测验维度增加, 估计精度仍比较好 ; 随着测验长度和维度间相关增加, 分类准确性和分类一致性更高。指标可以用来评价标准参照测验或计算机分类测验的多种决策规则下分类信度和效度。关键词多维项目反应理论; 决策规则 ; 分类一致性 ; 分类准确性 ; 信度 ; 效度分类号 B841 1 引言 2006; 辛涛, 李勉, 任晓琼, 2015)。 CRT 一般将被试分为“掌握、未掌握”或“初级、标准参照测验(CRT)关注学生具体知识或技能中级、高级”等表现水平, 测量结果直接决定学习进的掌握情况及达到的水平。CRT 有助于发挥考试的程、被试选拔和教学质量评价等。而测量往往存在诊断功能和促进学生发展, 从而对教育评价产生了测量误差, 如何根据标准和综合各种测验分数对被深刻影响(戴海琦, 2010) 。CRT 的广泛应用或需求, 试表现水平给出可靠而有效地评价 , 以及如何量化很好地体现了其在教育评价中的重要性：教育部基评价分类结果的一致性和准确性, 成为研究者关注础教育质量监测(NAEQ) 中心开发的监测工具采用的重点(Douglas Mislevy, 2010; 陈平, 李珍, 辛涛, 了 CRT; 美国的“力争上游”教改计划中强调采用新高慧健, 2011)。型标准和评价, 促使学生在大学或工作岗位上取得分类一致性是指两次平行测验中被试观察分成功, 在全球范围内具备更好的人才竞争力 ; 美国类相同的概率 , 主要反映测验信度; 分类准确性是前教育部长阿恩·邓肯(Arne Duncan) 曾表示“一旦指被试观察与真实分类相同的概率, 主要反映测验建立和采用新标准, 就需要创建新测试, 测量学生效度(Lee, Brennan, Wan, 2009; 陈平等, 2011)。分是否满足这些标准” (Duncan, 2009) 。CRT 已经广泛类一致性和准确性指标的发展趋势为：从平行测验应用于水平和资格考试等 , 如国际学生评估项目过渡到单个测验指标估计 ; 从经典测验理论 (CTT) (PISA) 、国际阅读素养进步研究项目(PIRLS)、国际过渡到项目反应理论 (IRT)下指标估计。本文关注数学和科学成就趋势研究(TIMSS) 、美国教育进步 IRT 下单个测验指标估计, 这是该领域的研究热点