- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十一章教育测量的常用指标分析
②非二值记分 【例1 0-1】以下是10名学生在一次测验中两道题上的成绩,请分别计算两题的难度水平。 ③分组法 2)项目受机遇影响的矫正 【例4】有一四择一的项目,答对该题的比率为0.30,排除猜测的影响,该题的难度是多少? 思 考 题 项目的难度是什么? 难度是等距量表吗? 难度的取值范围是多少? 等难度指数量表 当样本容量很大时,测验分数接近正态分布。 将项目的难度指数p作为正态由线下的面积,查标准正态分布表,就可以将等级量表表示的p值转换成具有相等单位σ的等距量表Z值。 P作为正态曲线下的面积时,要从右向左,这样才符合习惯,即Z值越大,难度越高。 【例如】求难度为0.8413的项目其等距难度指数是多少? 解:①查表的p值 导出分数 ETS:Δ=13+4Z 最低难度 最高难度 等难度指数量表在1-25之间,平均数为13,标准差为4。 区分度评估方法 1、项目鉴别指数 鉴别力指数与项目优劣的评定(伊贝尔的标准) 【例10-4 】:某高中物理成就测验,被试共100人,取上下27%的被试分别作为高低分组,其中高分者答对第1题的人数为18人,低分组答对第1题的人数为7人,试问该题的鉴别力是多少?如果相反,该题的鉴别力又怎样? 适宜的难度与区分度 当测验用于选拔或诊断时,应较多地选择难度值接近录取率的项目。如选拔提高难度,诊断应降低难度。 对于选择题来说,P值一般应大于随机作答正确的概率水平。如是非题,难度应该为0.75最为合适;而对于四选一的题目,其难度约为0.63时最为合适。 适宜的难度与区分度 为了使测验具有更大的鉴别力,应该选择难度在0.50左右的试题比较合适。但是,在实际工作中并非如此简单。如果难度都是0.50,而试题间都完全相关,则易形成“U形”分布。 区分度取值范围介于-1~1之间,假如项目得分与实际能力之间呈负相关,则区分度为负。这种情况一般很少发生,如果出现,该项目应该淘汰。 是对测量一致性程度的估计 操作定义就是一组测验分数中真分数方差与实测分数方差的比率 斯皮尔曼-布朗通式 【例11-6】:请估计下列测验的信度 三、测验难度的影响 测验难度与信度虽然没的真接的对应关系,但是当难度过高时,很多能力高的人也不能得分,从而导致误差加大,信度降低。 测验项目太难,分数在低分段聚集,测验分数和范围变窄,从而使信度降低。 但是难度过低时,分数在高分段集中,测验分数的分布同样变窄,信度同样降低。 通常难度为0.5左右,信度最高。 思考题 样本同质性高于常模,会高估还是会低估信度?如果低于常模呢? 信度较低时,应增加项目还是应删减项目 用标准误估计真分数的注意事项 对真分数作的区间估计,不可能因此得到一个确切的点,而是一个分布范围。两次测验之间微小的差别不能过分的解释。 置信水平确定后,估计的精度主要取决于 。 越大,精度越差, 越小,精度越好。 真分数不等于真正能力或特质。当系统误差对实测分数产生影响时,用此方法估计的真分数并非代表被试的真正能力或特质。 评估方法 进行实测,根据测试数据分析和被试作答 过程分析,全面验证测量工具的效度 思考以下指标用于一幼儿智力测验的效标是否合适: 同时期的考试成绩 韦氏智力量表(幼儿版) 韦氏智力量表(成人版) 适合幼儿的标准化成就测验 适合幼儿的能力倾向测验 适合幼儿的瑞文推理测验 父母的评定 EPQ(幼儿版) 两次施测时间间隔的长短会影响重测信度系数估计值的大小,因此,在报告重测信度系数时应该报告间隔的时间长度。 应该根据已有的相关研究结论考虑所测心理特质本身的稳定性程度,以确定前后两次施测时间的间隔究竟应该多长比较合适时,不应该随便选择间隔时间的长短 重测信度的注意点 测验A 时间间隔很短 测 验 B 测量的内容 施测顺序的影响 复本信度 是指两个平行测验测量同一批被试所得结果的一致性程度,根据一组被试在两个等值测验上的得分计算的相关系数即为复本信度系数。 等值测验或复本测验 1.两个在题目内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式和测验等其他方面都相同或相似的测验。 2.用不同的题目测量同样的内容而且其测验结果的平均值和标准差都相同的两个测验 复本信度 复本信度使用的条件 要构造出两份或两份以上真正平行的测验; 计算复本信度需要对同一批被试测试两份平行测验,需要合理的时间安排 应该尽量在测试结果报告中,详尽地说明两次测试的时间间隔、测试顺序安排、测试过程中被试的有关测验经历等。 内部一致性信度 同质性信度是指同一测验内部项目的一致性 反映的是题目内容的抽样一致性程度 具体估计方法:分半信度、库德-理查森信度、克龙巴赫Alpha系数 估计测验的内部一致性信度时,只要用同一个测
文档评论(0)