- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概化理论下的标准参照语言测试可靠性论证.pdf
第11卷第2期 西南农业大学学报(社会科学版) V01.11,NO.2
ofSouthwest ScienceEdition) Feb.2013
2013年2月 Journal AgriculturalUniversity(Social
概化理论下的标准参照语言测试可靠性论证
黄锐
(集美大学外国语学院,福建厦门 361021)
摘 要:测试结果的可靠性一直是教学关注的焦点。标准参照语言测试的信度估计通常用可靠性指标来估算,但测试本身所考虑
的误差和变量要比常模参照语言测试多,因此成为语言测试中的难点。它的可靠性估计除了考虑决策分类的一致性外,重点是概
化理论下的领域分数可靠性和切线决策一致性的论证。在概化理论下的标准参照语言测试的可靠性论证过程给经典测量理论下
的标准误和置信区间赋予了新内容,尤其是概化理论下的信噪比的定义和内涵为标准参照语言测试可靠性增添了新的内涵。因
此,概化理论下的标准参照语言测试可靠性分析在英语语言测试中应得到高度的重视并加以应用。
关键词:G理论;标准参照;语言测试;可靠性;信噪比
中图分类号:H314 文献标识码:A 文章编号:1672—5379(2013)02—0065—06
信度是关于测量结果偏离真值大小的量度,也 的一致性系数(agreement
是测试结果的稳定和一致性程度。在Glaser开创
数(Kappa
性的论文中,对测试分数的不同解释可以将测试分
test,CRT)和
为标准参照测试(criterion—referenced
化方法,对此,学界已有不少研究;后者则探讨了单
test,NRT)[1。。之
常模参照测试(Norm—referenced
后,专家们发现传统的基于经典测试理论(classical
ofdomain index,
ty score)、可靠性指数(dependent
test
theory,CTT)的NRT信度计算即真分数方差
loss
表示为(D)、平方误差损失方法(squared—error
与观察分数方差之比的方法已不适合解释CRT的
approaches),此类研究在英语语言测试界中还相对
信度:因为该信度系数依赖于个体真分数的变异性
薄弱。因此,本文拟对G理论下的CRT可靠性做
of score)比_J。然而,假
(variabilitypersons’true
进一步论证,并着重探讨与CRT可靠性指标紧密
设在CRT中所有的考生有相同的真分数,这样它
联系的置信区间(confidenceinterval,CI)、测量标准
们的值(value)就应高于预期的切线分数(cutting
errorof
误(standard
score),那么代表考生掌握与否的观察分数(真分数
(signal—t
文档评论(0)