信度与效度测量在大学英语测试中应用.docVIP

信度与效度测量在大学英语测试中应用.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信度与效度测量在大学英语测试中应用

信度与效度测量在大学英语测试中的应用   摘 要:信度和效度是评估语言测试最为关键的两个质量指标, 但两者在本质上又是相互冲突的。尝试论证在一定的约束条件下,为了使某一特定测试的总效用达到最大化,我们能够找到效度和信度之间最佳的平衡关系,由此而为大学英语测试的改革实践提供一些参考性建议。?   关键词:英语测试;效度;信度?   中图分类号:G64文献标识码:A文章编号:1672-3198(2008)06-0269-02??      1 引言?      据全国大学英语四、六级考试委员会与英国文化委员会的合作研究结果认为:CET4和CET6(简称)是一项信度极高的考试,每次考试客观题的内部信度都达0.9以上;效度相当高,回收问卷中有92%的教师认为CET能反映学生的实际英语水平。笔者以为这里所指的信度和效度的界定很模糊,就某次具体的测试而言,信度和效度是受特定条件限制的,不可能是绝对的。迄今为止,我国的高考、研究生入学考试、公共英语等级考试(PET),包括CET等大规模英语测试还是以客观性题型为主,主观题只占10%或20%左右。就评分方法而言,因客观性试题答案的唯一性,可用机器阅卷,从而保证了测试结果的客观性和一致性,无疑具有相对较高的信度,但不足之处就是效度难以保证。同时大量采用主观性、直接性试题的测试在阅卷信度上也令人怀疑。这样的困惑总是或多或少存地在于考试的开发、设计和评估过程中。?   我们能否使信度和效度同时最大化呢?信度和效度又应如何整合而达到适当的(appropriate)平衡?Bachman和Palmer在其测试理论中认为可设置“可接受的最低程度”(minimumacceptablelevel)的效度或信度等质量指标从而使得语言测试的“效用性”(usefulness)原则中各特征之间达到适度平衡。由于测试总是在一定的价值判断、测试目标、社会环境等约束条件下进行的,本文尝试探索在可行性条件下,测试的总效用(overallusefulness)最大化时效度和信度之间可能存在的关系。?      2 效度和信度的基本概念及特点?      如果我们想阐释一次特定的考试成绩是否正确反映了学生的语言能力,那么在设计和使用测试时,信度和效度是我们首要关注的特征。Bachman把信度定义为“测试的一致性”(consistencyofmeasurement)。简言之,就是测试结果的可信度、可靠度。例如,我们可以这样来检验测试的信度:使用同样一份试卷,在两种不同的场合、环境中,在较短的时间间隔内,施与同样的学生,如果测试结果基本吻合,那么证明该测试是有信度的。一份试卷的测试结果如果缺乏信度,就没有使用价值,同时也减弱了考试的公正性。当然,要完全消除不一致性(inconsistency)也是不可能的,我们能做的是尽量把影响不一致性的不利因素控制在最低程度,以便于提高测试信度。?   信度所涉及的问题是个体测试成绩在多大程度上是由测试误差或其它因素所影响的。效度所关注的问题是个体测试成绩在多大程度上和个体语言能力相关。因而,我们研究信度的目的是使测试误差造成的影响最小化,研究效度旨在使我们想要检测的语言能力的效果最大化,它们是两个相互补充的目标。一项测试若没有信度,也就无所谓效度。信度是效度的前提或必要条件。权衡信度和效度,效度是首要的。然而Underhill和Heaton指出信度和效度特征在本质上是互相冲突的。测试效度较高的试题有时测试信度较低。反之,测试信度较高的试题有时测试效度较低。Morrow也认为想把测试任务设计得既具有可信性又具有真实性不可能的。Hughes却说虽然测试的各种特征相互排斥,但是这并不意味着我们可以完全放弃这些特征。?      3 对信度和效度在理论上能达到适当平衡的可行性研究?      评价英语测试最重要的原则是总效用性(overallusefulness)。Bachman和Palmer(1996:18)把某一特定测试的“总效用性”看作是由六个因素构成的,即效用性(Usefulness)=信度(Reliability)+构想效度(Constructvalidity)+真实性(Authenticity)+互动性(Interactiveness)+冲击力(Impact)+适用性(Practicality)。这里需要说明的是:Bachman和Palmer之所以把“构想效度”作为“效用性”六大特征之一,是因为构想效度(上节已提到)关系到我们根据测试成绩所作的解释的意义性和适切性。前五者均与测试成绩的使用有关,而“适用性”与测试的方法有关,能够在很大程度上决定测试的可行性。评价一次考试是否有效用需要综合考察这些因素,在它们之间寻求最佳的平衡点,而这一平衡能否实现取决于适用性

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档