- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
十语言测试的信度
十 语言测试的信度
1 信度(Reliability)
语言测试的信度(又叫可靠性、可靠度),是检验语言测试结果一致性的量度。这种一致性或者是关于不同时间的一致性,或者是平行试卷之间的一致性,或者是不同评分者之间的一致性,或者是不同次测试成绩报告之间的一致性等等。信度通常由两列数据之间的相关系数来表示,也叫信度系数。
经典测试理论认为语言测试的报告分数(S)与考生的真实能力(ST,又叫“真分数”)存在误差(SE),三者之间存在如下关系:
S = ST + SE
考生的真实能力是无法直接得到的,测试成绩所反映的考生能力是根据考生在测试中的表现推断出的可观测的能力,这种能力用报告的成绩来表示。测试报告成绩有可能高于、低于或等于考生的真实语言能力,二者之间存在误差。
误差的来源主要有四个方面:
考生。如,考试时考生的精神状态(是否兴奋、情绪是否稳定、记忆及反应状况)、身体健康状态(是否劳累)
试题和试卷。如,试题的难易程度、试卷的长短、卷面是否能让考生接受(界面是否友好)
测试环境。如,考场是否符合测试要求(周围不嘈杂、考场设备正常等)、监考人员监考是否规范、友好(着装、走动、查看)
评分。如,评分标准、评分员对标准的理解、评分员的状态(精神及身体方面)、评分过程的安排(是否有质量监控)
上述由“试题和试卷”和“测试环境”造成的影响会对考生的表现产生影响。
误差有随机误差和系统误差之分:
随机误差。这种误差是“由于各种偶然因素的影响而使测验产生的误差,它主要表现在,用同一方法多次测量相同被试时,测得结果不完全一致,因而,随机误差没有规律性,这种误差是随机发生的,没有固定倾向,时高时低,……随机误差必然影响测验信度。导致随机误差产生的因素很多,有量表的特点,有测验的程序,有测验中环境的影响,也有被试在测验过程中身心状态等。”(朱德全、宋乃庆,2007)
系统误差。这种误差是“由于量表有问题或评分标准掌握过宽或过严等原因导致测验结果成倾向性的偏大或偏小。因而系统误差虽然导致测量不准确,但不影响测量结果的稳定性或可靠性,所以不影响测验信度。”(朱德全、宋乃庆,2007)
关于报告分数、真分数和误差分数之间的关系,人们有如下基本意见:
报告分数中包含着真分数和误差,即:S = ST + SE
误差分数是随机的、偶然的,它和真分数之间没有必然的联系
由于误差分数有正有负,对一个大规模的考生群体来说,误差分数的均值可能等于0
2 信度的种类
人们一般采用相关分析的方法来估计一种语言测试的信度的高低。如果一种测试前后两次对同样的考生进行测试,两次测试的结果的相关系数(rXY)大,则说明该测试的信度高;两次测试的结果的相关系数(rXY)小,则说明该测试的信度低。
(1)相关分析
事物之间的关系大致有三种:因果关系(如,努力程度与成绩高低)、共变关系(如,草与树的生长都跟气候有关)、相关关系(两类现象在发展变化的方向与大小方面存在一定的联系,但不能确定也不能排除它们之间是否存在因果或共变关系,如,学生的汉语水平与计算能力)
相关关系有三种表现:
正相关。两列变量的变动方向相同,即一种变量变动时,另一种变量也同时发生或大或小与前一种变量同方向的变动。如,一般情况下,人的身高与体重。
负相关。两列变量中有一列变量变动时,另一列变量呈现出或大或小当与前一列变量方向相反的变动。如,一般情况下,人到了中老年后,年龄的增长与记忆能力的下降。
零相关。两列变量之间没有关系,即一列变量变动时,另一列变量呈无规律的变动。如,个子的高低与智力水平的高低。
相关系数(coefficient of correlation, rXY)是用来说明相关关系强度的指标,它的取值范围是:
-1 ≤ rXY ≤1 (可以取小数)
相关系数取值大小表示相关的强弱程度:相关系数的绝对值在1和0之间,表示相关程度的高低,越接近1,相关程度越高;越接近0,相关程度越低。
考察变量之间的相关关系要考虑样本量的大小。样本量过小,可能得出本不相关的变量却相关的结论。
两列变量X、Y的相关关系可以用XOY坐标系描绘出来(散点图):
正相关 负相关
零相关
(2)信度的种类
根据估计信度的计算方法的不同,信度可以分为再测信度、复本信度、内部一致性信度和评分者信度等。
1)再测信度
再测信度是一种表示测验稳定性的方法,用稳定性系数表示。稳定性系数是用同一试卷先后对同一组考生施测后求得的实得分数的相关系数。
计算再测信度的基本模式为:
适当时距
测试A 测试A
计算再测信度可用积差相关系数计算公式:
例如(朱德全、宋乃庆,2007:142)
测试T施测于14名考生,
您可能关注的文档
最近下载
- 天津大学测控电路试卷.doc VIP
- 西 藏图考 清 黄沛翘(国立中央图书馆典藏).pdf
- 商标使用许可备案提前终止协议书8篇.docx VIP
- 2025年成都百万职工技能大赛(快递员)备赛试题库(含答案).docx
- 材料概论-第二章课件.pptx VIP
- 工业机器人编程与操作(FANUC)配套课件.ppt
- 第一单元 快乐的课堂 1~5 数的认识和加减法(单元测试基础卷)数学青岛版一年级上册(A3).pdf
- 2025广西公需答案01.pdf
- (高清版)DBJ50∕T-396-2021 山地城市地下工程防渗堵漏技术标准.pdf VIP
- Q TZW 22-2016_烧烤工具 企业标准.pdf VIP
文档评论(0)