测验分数可比性和测验等值.pptVIP

  • 2
  • 0
  • 约5.63千字
  • 约 44页
  • 2019-12-22 发布于广东
  • 举报
铆测验非等组设计计算 心理测量学 江西师大心理与教育统计测量中心 铆测验非等组设计线性等值方法计算公式如下: 其中, 是x测验向全体被试t施测时的平均数与标准差的估计值, 是y测验向全体被试t施测时的平均数与标准差的估计值。 心理测量学 江西师大心理与教育统计测量中心 如果两组被试能力差异不大,四项估计值为: 心理测量学 江西师大心理与教育统计测量中心 其中, 与 是只参加测验x被试的平均数和标准差, 与 是只参加测验y被试的平均数和标准差, 与 是铆测验向全体被试t施测得到的平均数和标准差, 与 是既参加测验x又参加铆测验被试的平均数和标准差, 与 是即参加测验y又参加铆测验被试的平均数和标准差, 是测验x对测验v的回归系数, 是测验y对测验v的回归系数。 心理测量学 江西师大心理与教育统计测量中心 如果两组被试能力有差异,这四项估计值为: 式中, 、 、 与 分别是各个测验的信度系数。 本章小结 心理测量学 江西师大心理与教育统计测量中心 测验等值是测验公平性的保证,其在测验实施、编制与结果分析,题库的建立,不同单位、地区、时间所测学科成绩的比较等方面,都是极为必要的。 本章小结 心理测量学 江西师大心理与教育统计测量中心 如果不进行等值处理,不同时间举行的考试的成绩之间不具备可比性,评价标准或证书授予标准会受到试卷难度起伏的影响。这种状况,不仅影响到选拔效率和人员素质,而且对考生也是很不公平的。 本章小结 心理测量学 江西师大心理与教育统计测量中心 等值研究的意义并不局限于保证考试公平。今天,为了避免命题和试卷编制中的盲目性和偶然性,国内许多考试机构都在致力于建设题库。实现基于项目反应理论(Item Response Theory,简称IRT)的题目参数等值是建设科学化、大规模题库的前提。 本章小结 心理测量学 江西师大心理与教育统计测量中心 基于经典测验理论(Classical Tesing Theory,简称CTT)之上的等值方法只能实现不同试卷之间的等值,满足“试卷库”建设的需要,很难实现在统一的量尺上标定试题难度和区分度的任务,很难满足大规模题库建设的需要。 参考文献 心理测量学 江西师大心理与教育统计测量中心 参考文献 [1]叶佩华等译:测验等值,广东高教出版社1988年出版。 [2]漆书青、戴海琦、丁树良编著:现代教育与心理测量学原理,江西师大心理与教育统计测量中心2002年出版。 [3]漆书青编著:现代测量理论在考试中的应用,华中师范大学出版社2003年出版。 参考文献 心理测量学 江西师大心理与教育统计测量中心 参考文献(续) [4]戴海琦、张峰、陈雪枫编著:心理与教育测量,暨南大学出版社2006年出版。 [5]戴海琦.锚题题型与等值估计方法对等值的影响.心理学报,2002,34(4):367-370。 [6]罗照盛.经典测量理论等值的误差研究.心理科学,2000,23(4):494 –501。 参考文献 心理测量学 江西师大心理与教育统计测量中心 参考文献(续) [7]Angoff, W. H. (1971). Scales, norms, and equivalent scores. In R. L. Thorndike (Ed.), Educational measurement (2nd ed.) (pp.508-600). [8]Washington, DC: American Council on Education. Psychological Measurement, 14, 313-321. 参考文献 心理测量学 江西师大心理与教育统计测量中心 参考文献(续) [9]Lord, F. M.(1980) Applications of item response theory to practical testing problems, Lawrence-Erlbaum Associates. [10]Michael. J.Kolen Robert L.Brennan. Test Equating, Scaling, and Linking: Methods and Practices (2nd ed.) New York: Springer, 2004. 参考文献 心理测量学 江西师大心理与教育统计测量中心 参考文献(续) [11]Kolen,M.J.(1988). Traditional equating methodology. Educational M

文档评论(0)

1亿VIP精品文档

相关文档