浅谈语言测试效度.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅谈语言测试效度.doc

浅谈语言测试效度   摘要:测试效度是语言测试学领域至关重要的概念之一,也是众多语言学家科研的重点。它是测试质量审定的主要依据,直接关系到测试质量的高低。因此有必要对语言测试的效度及相关研究成果进行整理和分析,加深人们对此的理解,以期对语言测试起到积极的作用。   关键词:效度;表面效度;内容效度;结构效度;尺度相关效度   中图分类号:GH319文献标识码:A文章编号:1671—1580(2013)06—0072—03   语言测试的质量主要可以通过信度、效度、真实性、相互作用性、后效作用和可行性来进行评估。其中,效度是所有出题人最为看重的测试质量审定的主要依据,它直接关系到测试质量的高低。在语言测试这一领域里,这一概念被反复提及和讨论。语言学家们普遍认为效度是测试中最为重要的用以衡量考试科学与否的标准。Bachman指出,“效度是测试应用中最为重要的指标”。[1]   一、效度的定义   在语言测试领域,许多语言学家致力于效度的研究,他们从不同的角度阐释了效度这一概念。Bachman 的定义如下:   测试的效度是指考试在多大程度上测出预期要测量的东西或者说考试在多大程度上完成了预期的测量任务, 达到了预期测试的目标。 [2]   Bachman 的定义道出了效度的实质,简而言之,就是考试达到其预期测试意图的程度。如果一种测试没能测试出预期要测试的东西,那么这一测试便不具有相应的效度,以至于不能提供关于受试者语言能力真实水平的有价值的信息。   Henning (1987: 89) 则这样诠释效度:   测试效度所指的是测试的得体性,即测试的内容是否检测了想要检测的内容。如果一种测试在某种程度上达到了它设计的预期目的,那么这一测试就是有效的。而这种有效是相对的,仅对一些测试目的而言,并非所有测试目的。[3]   Henning的定义更加明确了效度与测试目的的关系。效度并非万能的,它不是无所不包的。事实上,完美的效度也不是一蹴而就的。就像Alderson指出的那样:“就测试目的而言,每一种测试都或多或少具有效度;效度并非是一个成败在此一举的因素。” [4]   Arthur Hughes则以更为直接、简练的方式定义了效度。他说如果一个测试精确地测试出它所要测试的东西,那么这一测试就是具有效度的。[5] 然而,我们也从后来的测试效度研究成果中看到了Hughes 关于效度定义的局限性。在2000年,McNamara提出了他的独到见解,他强调了受试者在测试过程中的表现应是他真实语言水平和技巧的精准再现[6]。这种再现越真实地反映受试者的语言能力,测试的效度才越高。   总体来讲,效度是测试领域里最为重要的概念之一,人们以此来衡量测试的得体性。假设一个测试准确地测试出了它想要测试的受试者的真实的语言水平和技巧,那么这一测试就是效度高的。反之亦然。   二、相关研究   效度是一个多面体,以至于语言学家们从各个侧面去丰富它的内涵,探讨它的现实意义。其实,这所谓的“侧面”就是评价效度的不同方式,学者们从不同的角度、各异的出发点将效度分类探讨。总体上看,主要分为内部效度(通常包括表面效度、内容效度),外部效度(也称尺度关联效度,通常包括同期效度、预测效度)和结构效度[4]。但需要强调的是不论如何将效度分类,它都是一个“统一的概念”。   (一)表面效度(Face Validity)   Hughs (1989)认为如果一个测试看上去测试了它所预期要测试的能力或知识掌握程度,那么这一测试就具备表面效度。[5]例如,英语听力测试要求受试者听完一段听力材料后回答问题,那么这一测试从卷面上看就具备表面效度。Ingram则指出,表面效度是指试卷表面形式的可信度和公众对测试的接受度。[7] 从某种意义上讲,表面效度可说是效度的“外表”,通常由人们对于测试的印象判断试卷是否具备表面效度。事实上,表面效度与对试卷内容的直觉判断密切相关,而做出这些判断的人们往往不是专家,而是测试管理人员、受试者、教育者等等。如果一个测试在受试者的眼中是能够测试出他的水准的,我们就可以说它具有表面效度。有些学者认为它并不科学,但这却直接影响了人们对于测试的接受程度。假如受试者相信某个测试能够衡量相关的能力,他们会尽力完成好它以展现自己的水平和能力。反之,则不会认真对待。因此,越来越多的专家学者肯定了表面效度在语言测试中的重要地位。Heaton作为他们中的一员,称其为公共关系练习,并指出大多数交际测试的出题者把它当作最为重要的测试效度。[8]   (二)内容效度(Content Validity)   Kerlinger认为内容效度指的是“一测量工具内容上的代表性或所选内容样本的充分性”。 [9]这也就是说,内容效度强调的是测试内容的相关性

文档评论(0)

sis_lxf + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档