- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 教育测量与评价的质量特性教育测量的质量特性衡量教育测量的质量,可采用四个指标: 信 度 主要对整个测验而言。 效 度 难 度 主要对测验项目而言。 区分度第一节 教育测量与评价的信度一、信度的意义信度(reliabity)测量结果的可信程度和稳定性程度记为rxx二、信度的统计定义观察分数真分数测量误差第一,信度是观察分数与真分数相差的程度;E = X - TX = T + E 要比较两种测量结果的信度,一定要看测量误差(E)对于真分数(T)所占的百分数是多少。这个百分数表示该观察分数(X)的相对误差。 相对误差=E/T×100% 例:试比较以下两次测量结果(只进行一次)的信度。 用尺子量100cm高的一个儿童,得到1cm的绝对误差;量185cm高的一位运动员,也得得到1cm的绝对误差。 把上述两次测量(设为甲和乙)和绝对误差分数和真分数代入上式,得: 相对误差(甲)=1/100×100%=1% 相对误差(乙)=1/185×100%=0.54%据此,度量乙的信度要比度量甲的信度高。最大绝对误差=E/X ×100% 怎样估计对一组人或一个人测量多次的实测值与真值(真分数)的差异程度呢?判别两组数据谁好谁差,关键是确定这两组数据偏离各自的平均数的大小。为了消除数据容量的影响,可借鉴研究加权平均数的方法,选用各个偏差的平方的平均数,来描述一组数据偏离其平均数的大小,这就是方差。根据假设,观察分数的方差应等于真分数的方差加上测量误差的方差。即:测验的信度一般在0和1之间取值, rxx越接近1,考试的信度越高。第二,信度是一个被测团体的真分数方差与观察分数方差之比:即第三,信度是一个被试团体的真分数与观察分数的相关系数的平方,即:第四,信度是一个被试团体在测验X(A卷)上的观察分数与在测验X的任意一个“平行测验”(B卷)上的观察分数的相关系数。即: 三、信度的估计方法重测信度(test-retest reliability)又称稳定性系数,指用同一个量表(测验或评价表)对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数;相关系数可以用不同方法计算,这取决于数据的性质。最为普遍的是皮尔逊积差相关系数:例1:在政治科目考试后一周,随机抽取10名学生进行重测,其先后两次考试成绩如表3-1中的Xi栏和Yi栏中的数据所示,试求该政治科目考试的一个重测信度。通过计算可知: 把上述数据代入下列公式,可得 采用重测法计算稳定系数,需注意:两次测验之间的时间间隔要适宜,尽可能在较短的时距内进行;两次测验试卷要等值,即在内容范围、题型、题数、难度、区分度等方面要基本相同;确定两测验是否等值,还要考察两次测绘结果的平均数与标准差;重测法适用于速度测验(运动技能)而不适用于难度测验;测试应注意提高被试者的积极性。复本信度(alternate- forms reliability)又称为平行测验(equivalent forms test, parallel forms test)。指在试题格式、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验。等值性系数(coefficient of equivalence):在同一时间连续施测,反映测验内容造成的误差是多少;等值稳定性系数(coefficient of stability and equivalence):不仅反映出测验内容的抽样误差,而且也反映了被试本身状况的改变。 例:以A、B两型英语复本测验对初中三年级10个学生施测,为避免由测验施测顺序所造成的误差,其中5个学生先做A型测验,休息15分钟后,再做B型测验;而另5个学生先做B型测验,休息15分钟后,再做A型测验。10个学生A型测验结果记为X,B型测验结果记为Y,其测验的复本信度如何?学生序号1 2 3 4 5 6 7 8 9 10 X 19 19 18 17 16 15 15 14 13 12 Y 20 17 18 18 17 15 13 15 12 12复本信度的优点:测验的两个复本,如果在不同的时间使用,其信度既可以反映在不同时间的稳定性,又可以反映对于不同测题的一致性;两个复本在同时使用时,可以避免再测信息的一些缺点,如首测时再测在记忆、练习、效果的影响,间隔期间获得新知识的影响,两次施测的环境不同和被试主观状态不同的影响,以及为了应付测验所作训练的影响等。复本信度的缺点:编制两个完全相等的测验是很困难的,如果两个复本过分相似,则变成再测形式,而过分不相似,又使等值的条件不存在;两个复本测验有可能在某种程度上测
文档评论(0)