基于经典测量理论初中数学试卷质量分析.docVIP

下载本文档

17
0
约4.76千字
约 11页
2018-07-03 发布于福建
举报
版权申诉

基于经典测量理论初中数学试卷质量分析.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于经典测量理论初中数学试卷质量分析

基于经典测量理论初中数学试卷质量分析　　摘要：本文利用南宁市某中学2013年秋季学期数学期末考试成绩，在经典测量理论（CTT）范畴下探讨了该次期末考试数学试卷的信度、效度、难度、区分度和成绩分布情况，结果显示，该试卷信度高、难度适中、区分效果好、知识覆盖面广，试卷质量较高。　　关键词：经典测量理论信度难度区分度　　一、引言　　教育测量与评价是教育研究领域中重要的组成部分，是学科教学活动中科学管理的有效手段。《国家中长期教育改革和发展规划纲要（2010-2020年）》明确把提高教育质量作为教育改革发展的核心任务，并多次强调与教育质量的监测和评价相关的内容[1]。显然，在当前教育制度下，各种笔试仍是一种重要而有效的教育质量定量评价方式。试卷质量自然影响对教育质量的正确评价，因此，针对笔试试卷的质量分析显得尤为重要。　　试卷质量的分析一般是利用经典教育测量理论（CTT： Classical Test Theory）和项目反应理论（IRT：Item Response Theory）进行分析。　　经典测量理论又称为真分数理论，假定观察分数X与真分数T线性相关，即CTT的数学模型为X=T+E，其中，随机误差E服从均值为零的正态分布。该理论最重要的四个指标正是反应试卷是否真实可靠、准确有效、难易适中、鉴别力强的信度、效度、难度和区分度等测验质量指标[2]。当然，由于其比较依赖样本、信度估计精度不高、难度和被试水平没有定义在同一参照系上，同时，无法回答总分相同的考生的真实能力有无差异等问题，该理论也存在一定的局限性[3]。　　项目反应理论是一种新兴的心理与教育测量理论。该理论的前提假设非常严格，主要包括单维性假设和局部独立性假设[4]。主要方法是在利用参数模型的基础上，利用项目特征曲线、试题信息函数进行探讨，同时利用EM算法，用边际极大似然估计方法寻找项目参数的一致估计[5]。　　本文主要利用南宁市某中学2013年秋季学期数学期末考试成绩，在经典测量理论（CTT）范畴下探讨该次期末考试数学试卷的信度、效度、难度、区分度和成绩分布情况。通过试卷“四度一分布”了解试卷质量，并反馈教学效果情况。　　二、基于CTT的试卷质量情况分析　　1.成绩分布情况　　一般而言，一份好的试卷考试的成绩都服从或近似服从正态分布，因此，考试成绩的正态性是考察试卷质量的一个首要指标。检验正态性的方法很多，常见的是利用直方图和卡方检验、K-S检验。从参加本次考试的872人中随机抽取387人的成绩进行检验，结果如图1所示：　　图1 学生成绩的直方图　　正态分布的K-S统计量显著性概率P值为0.0950.05，因此，这次考试学生成绩服从正态分布。　　2.信度　　中学试卷中，选择题分数可简化为0，1得分情况来解释，解答题和填空题可以看成非0，1记分的项目。因此，选择题信度主要采用折半信度[斯皮尔曼-布朗（Spearman-Brown）公式、卢隆（Rulon）公式、弗拉纳根（Flanagan）公式]和库德-理查逊（Kuder-Richardson）信度（K-R20、K-R21公式）进行分析[7]。填空题和解答题为非0、1记分的项目，采用克龙巴赫系数进行统计，结果如表1所示。　　表1 试卷信度分析结果　　结果表明，每种方法计算的选择题信度都接近0.7，信度系数处于尚可使用范围之内。研究表明，对于标准化的大型测试题目信度要求一般要在0.9以上，而学校期末考试的信度在0.6以上即可接受[1]。选择题、解答题的克龙巴赫系数为0.905，可以认为填空题和解答题的信度非常好，综合考虑，试卷整体信度是可信的。　　3.效度　　效度（validity）是指测验结果的有效性或准确性，即通过测验能够正确测量出它所要测量的属性的程度[5]。测量的效度的种类很多，其中基于专家和教师对试题与所涉及的范围进行符合性判断的逻辑判断法的内容效度使用较多。内容效度是指测验内容对所要测验的全部内容的代表性程度。但一次考试很难包含学生所学课程的所有内容，因此只能选择具有代表性的试题进行考核，来了解学生的知识技能掌握情况[8]。　　根据测量的目标与内容的双向细分表，经过该校7位一线数学教师（其中高级教师4位，中教一级2位，中教二级1位）不记名反馈信息来看，本次考试所设计的试题覆盖了所要测内容的主要方面，考查目标清晰明确，题型和分数结构合理恰当，总体符合考试大纲和教学要求。　　4.难度　　试题难度是反映考题难易程度的指标，一般而言是按照答对人数的百分比确定的，是衡量试卷质量的最主要的数量性指标，简单来说可以利用测验分数的分布情况和特征进行观测，例如考察测验分数的全距、零分、满分、众数、平均分数等相关指标进行定性的判断，也可以根据不同的情况，利用有关公示进行精确计算。