十一种语言考试的有效性.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
十一种语言考试的有效性

十一 语言测试的效度 1 效度(validity) A measure is valid if it does what it is intended to do, which is typically to act as an indicator of an abstract concept (for example height, weight, time, etc.) which it claims to measure. The validity of a language test therefore is established by the extent to which it succeeds in providing an accurate concrete representation of an abstract concept (for example proficiency, achievement, aptitude). 效度就是测验测到它打算测的东西的程度,或者说,是根据测验分数所作出的推论的恰当性程度。 一项语言测试,它测的到底是什么;对设计者打算测量的某种心理属性,它测得的程度如何;根据测试的结果,可以作出怎样的推论与解释。诸如此类的问题都与测试的效度有关。 2 效度的种类 效度通常有如下几种: 结构效度/构念效度/构想效度(construct validity) 内容效度(content validity) 效标关联效度(criterion-related validity),包括 同期效度/同时效度(concurrent validity) 预期效度(predictive validity) 表面效度/表层效度(face validity) (1)结构效度/构念效度/构想效度(construct validity) 概念 构想效度是指测验成绩能够解释心理学理论上的某种结构或特质的程度。……所谓构想,是指心理学理论所涉及的抽象而属假设性的概念、特质或变量,如智力、能力倾向、行为习惯、成就动机、人格结构等。 语言测验的作用是测出人的语言能力,这就要求我们首先要提出关于‘语言能力’的构想,亦即我们要说明所谓的语言能力是什么东西、有什么性质。由于语言能力在人的大脑里,到目前为止我们还不能直接看到它,也不能测量它,所以,我们关于语言能力的构想是带有假说的性质的。 验证、确定构想效度的方法 结构效度验证,就是要考察一个测验,测到这种结构与特质的程度。……因为结构效度验证的着重点,是在考察测验测到某种心理结构或推论出某种心理结构这一点上,所以,结构效度验证的过程,通常是从定义结构的应有含义开始,说明某一特质的心理学意义是什么,跟其他特质有何关系,跟具体的可观察的行为有何关系。然后,根据这种理论定义,推出一些可能存在的假设,再利用测验去检验这些假设,看看这些假设能否成立。若能成立,测验的结构效度就得到了证实。 就心理测量而言,确定构想效度的步骤和方法是:首先根据一定的心理学理论建立某种心理品质的理论结构;然后根据这一理论结构提出有关测验成绩的假设;最后用逻辑和实证的研究由果求因来验证提出的假设。 就语言测试而言,建立结构效度通常包括以下步骤:(1)提出或选择关于语言能力的理论假设;(2)对预计要测量的语言能力进行操作性定义;(3)设计和开发测验;(4)考察测验分数与其他语言能力效标的关系;(5)检验测验对理论的拟合程度;(6)技术性修改,而后重复(4)、(5);(7)修正理论假设,重复(2)后所有步骤。 验证构想效度的定量研究方法 1)相关分析 我们检验测验的不同部分之间或不同的测验之间的相关程度,以此来确定测验能否得到这方面证据的支持。……例如,一个语法测验和一个阅读测验,如果有正相关,说明他们测的可能是同一个构想,如果没有相关或是有负相关,可能说明它们测的是不同的构想。 2)因素分析/因子分析 我们通常的考试或测验,一般都包含多个试题(有的是成百个)或多个分测验,考试与测验的总分,是由所有这些试题或分测验的成绩所决定的。但是,这些试题与分测验并不都是完全独立、互不相关的。相反,其中许多或好几个试题与分测验,可能是相同地测查或基本上共同地测查某一特质的;或者说所有这些试题或分测验,可能划分为若干个组,每个组共同测查或大致共同测查同一个方面的东西。这些组的个数,当然比原来考试或测验所包含的试题与分测验个数要少。这样,整个测验的分数,就可用这少数几个变量或因素来加以解释,从而使问题显得更为简化与明确。所以,对测验资料作因素分析,搞清测验实际上所测查的因素主要有几个,正是测验结构效度验证的一个重要方面或一个重要办法。 例如 APIEL(Advanced Placement International E

文档评论(0)

f8r9t5c + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档