测验分数可比性和测验等值.pptVIP

下载本文档

2
0
约5.63千字
约 44页
2019-12-22 发布于广东
举报

测验分数可比性和测验等值.ppt

铆测验非等组设计计算心理测量学江西师大心理与教育统计测量中心铆测验非等组设计线性等值方法计算公式如下：其中，是x测验向全体被试t施测时的平均数与标准差的估计值，是y测验向全体被试t施测时的平均数与标准差的估计值。心理测量学江西师大心理与教育统计测量中心如果两组被试能力差异不大，四项估计值为：心理测量学江西师大心理与教育统计测量中心其中，与是只参加测验x被试的平均数和标准差，与是只参加测验y被试的平均数和标准差，与是铆测验向全体被试t施测得到的平均数和标准差，与是既参加测验x又参加铆测验被试的平均数和标准差，与是即参加测验y又参加铆测验被试的平均数和标准差，是测验x对测验v的回归系数，是测验y对测验v的回归系数。心理测量学江西师大心理与教育统计测量中心如果两组被试能力有差异，这四项估计值为：式中，、、与分别是各个测验的信度系数。本章小结心理测量学江西师大心理与教育统计测量中心测验等值是测验公平性的保证，其在测验实施、编制与结果分析，题库的建立，不同单位、地区、时间所测学科成绩的比较等方面，都是极为必要的。本章小结心理测量学江西师大心理与教育统计测量中心如果不进行等值处理，不同时间举行的考试的成绩之间不具备可比性，评价标准或证书授予标准会受到试卷难度起伏的影响。这种状况，不仅影响到选拔效率和人员素质，而且对考生也是很不公平的。本章小结心理测量学江西师大心理与教育统计测量中心等值研究的意义并不局限于保证考试公平。今天，为了避免命题和试卷编制中的盲目性和偶然性，国内许多考试机构都在致力于建设题库。实现基于项目反应理论（Item Response Theory，简称IRT）的题目参数等值是建设科学化、大规模题库的前提。本章小结心理测量学江西师大心理与教育统计测量中心基于经典测验理论（Classical Tesing Theory，简称CTT）之上的等值方法只能实现不同试卷之间的等值，满足“试卷库”建设的需要，很难实现在统一的量尺上标定试题难度和区分度的任务，很难满足大规模题库建设的需要。参考文献心理测量学江西师大心理与教育统计测量中心参考文献 [1]叶佩华等译：测验等值，广东高教出版社1988年出版。 [2]漆书青、戴海琦、丁树良编著：现代教育与心理测量学原理，江西师大心理与教育统计测量中心2002年出版。 [3]漆书青编著：现代测量理论在考试中的应用，华中师范大学出版社2003年出版。参考文献心理测量学江西师大心理与教育统计测量中心参考文献（续） [4]戴海琦、张峰、陈雪枫编著：心理与教育测量，暨南大学出版社2006年出版。 [5]戴海琦.锚题题型与等值估计方法对等值的影响.心理学报，2002，34（4）：367-370。 [6]罗照盛.经典测量理论等值的误差研究.心理科学,2000，23(4):494 –501。参考文献心理测量学江西师大心理与教育统计测量中心参考文献（续） [7]Angoff, W. H. (1971). Scales, norms, and equivalent scores. In R. L. Thorndike (Ed.), Educational measurement (2nd ed.) (pp.508-600). [8]Washington, DC: American Council on Education. Psychological Measurement, 14, 313-321. 参考文献心理测量学江西师大心理与教育统计测量中心参考文献（续） [9]Lord, F. M.(1980) Applications of item response theory to practical testing problems, Lawrence-Erlbaum Associates. [10]Michael. J.Kolen Robert L.Brennan. Test Equating, Scaling, and Linking: Methods and Practices (2nd ed.) New York: Springer, 2004. 参考文献心理测量学江西师大心理与教育统计测量中心参考文献（续） [11]Kolen,M.J.(1988). Traditional equating methodology. Educational M

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

测验分数可比性和测验等值.pptVIP