基于信度和效度在优化试卷中的研究分析.pptVIP

基于信度和效度在优化试卷中的研究分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于信度和效度分析在优化试卷中的研究 鉴于传统试卷教师较多凭借经验出题,很难能够全面客观地检测学生的学习效果。同时,由于统计知识缺乏,对考试结果也难于做出合理解释,结果会造成考试结果中蕴藏的大量信息被淹没浪费。 因此,对试卷的可信度和有效度进行分析,可帮助教师掌握试卷定量分析技术,优化并提高试卷质量,增强科学解释考试结果以及从考试结果中提取有用信息的能力,以便能更好的提高教学及教学反馈的质量。 信度和效度可以作为反映试卷质量的重要指标,通过试后分析信度和效度等试卷定量评价技术,能提高考试试卷的质量,并增强考试结果解释力,继而从考试结果中提炼出科学有用的信息,最后针对优化试卷提出具体的措施。 信度 信度(reliability)即可靠性,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度。从另一方面来说,信度就是指测量数据的可靠程度。 举例而言,对于“图书馆利用情况及满意度调查问卷”的第一部分第1题,若对同一个人相隔3天,问同一个问题, 重测信度 重测信度(test-retest reliability)也称为再测信度,是对同一组被调查人员采用相同的调查问卷,在不同的时间点先后调查两次,两次调查结果之间的差异程度。重测信度反映了随机误差的影响。 复本信度(Parallel-forms Reliability)又称为等值性系数,是等值性信度(Equivalence Reliability)的一种,指问卷调查结果相对另一个非常相同的问卷调查结果的变异程度,是对同一组被调查人员运用两份内容等价但题目不同的问卷进行调查,然后比较两组数据的相关程度 试卷的可信度分析 试卷的可信度 . 亦称信度’是指试卷测试分数所具有的一致性或稳定性的程度. 所谓一致性是指同一测试项目测试结果的一致程度,较高的一致性即意味着同一群学生接受同一试卷测试结果间显示出强烈的正相关. 所谓稳定性则是指在前后不同的时间内,对相同考生重复测试所得结果的相关程度信度是指测量结果的稳定性程度. 效度 (Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。效度是指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。 反映结果真实性和有效性的程度 效度的概念有几个方面内容效度、标准相关效度、结构效度、表面效度等。 其中内容效度是最重要的,如果测试内容不能测试被测试者的能力,那么这个测试就失去效度。 内容效度研究有以下几个方面 测试内容是否和测试目标有关 测试内容是否有代表性 测试内容是否全面充分地体现了要考查的各方面内容 试卷中是否有足够的题目去体现所要考的各方面内容,测试内容是否适合测试对象等 皮尔逊相关系数 考试是一种测量,试卷就是进行测量的工具.要 提高测量的精度,就得在测量工具上下大功夫.运用 科学的测量理论对组成试卷的一道道试题进行分 析取优弃劣。 * 信度是指测量结果的稳定性程度 。 信度 重测信度 复本信度 分半信度 同质性信度 评分者信度 内部一致性系数 同质性信度:也被称为内部一致性信度,它可 以用来说明考试内部所有题目之间的一致性程 度。同质性信度高说明考试所测的内容或特质 的相似性高。测验内部的各题目在多大程度上考察了同一内容. 克伦巴赫α系数(适用多级记分的测验) 值越大表示试卷项目间相关性越好,内部一致性可信度越高 克伦巴赫α系数: K为量表中题项的总数, S2i为第i题得分的题内方差, S2x为全部题项总得分的方差。 α>0.8,极好 0.6 < α<0.8,较好 α< 0.6,较差 例1:有5题问答题,每题问答题配分是5分,施 测5名学生,以下是施测结果,请计算信度。 人名 题1 题2 题3 题4 题5 曾某 3 4 4 3 5 晁某 4 3 4 3 3 王某 2 3 3 2 3 胡某 4 4 5 3 4 梁某 3 2 4 3 3 张某 3 2 3 2 3 人名 题1 题2 题3 题4 题5 总分 曾某 3 4 4 3 5 19 晁某 4 3 4 3 3 17 王某 2 3 3 2 3 13 胡某 4 4 5 3 4 20 梁某 3 2 4 3 3 15 张某 3 2 3 2 3 13 S2i 0.4722 0.6667 0.4722 0.2222 0.5833 7.4722 即测量结果与试图测量的目标之间的接近程度。本研究通过计算 各试题考生得分与其卷面总成绩的相关系数来反映各试题的效度。一般认为相关系数在 0.4-0.8,比较理

文档评论(0)

cc880559 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档