- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
科技信息 2008 年 第 17 期 SCIENCE TECHNOLOGY INFORMATION
我们知道 , 测试是教与学的向导 , 而为了让它发挥出向导的作用 , 一份好的试卷是必不可少的 , 而且是至关重要的 . 一般情况下 , 我们判 断一份试卷的好坏的主要标准是 :是否有信度、 效度、 区分度、 实用性、 全面性、 公正性及后期效应。其中 , 以信度和效度最为重要。
一、 语言测试的信度
语言测试的信度 , 又叫可靠性 , 是指考试结果的可靠性和稳定性。 即看学生的分数是否稳定 , 如果同一个学生做同一套试卷 , 做的几次 的结果都是一致的 , 那么我们说这次考试是有信度的 ; 反之 , 如果分数 忽高忽低就说明信度不高 , 那么表明考试的信度不高。
信度可以分为复测的效度、判卷的效度和每一个测试项目的效 度。 同一学生
不管考多少次 , 所得的分数都是一样 , 那么就说这个分数 有复测的可靠性。影响分数的一个很重要的因素就是判卷人 , 在判卷 过程中 , 不同的判卷人对同一试卷也会做出不同的反映 ; 同一个人在 不同的时间对同一试卷给的分数也是不一样的。 试卷不仅要达到其整 体的可靠性 , 而且每一题都必须能达到这个标准 , 那才是一份有信度 的试卷。
与能力无关却又会影响试卷信度评判的因素有很多 ,例如 :1. 考 试条件差 , 天气热、 考场周围太吵闹等。 2. 考试条件不一样。 同一个学 生在安静与吵闹的环境中做同一份试卷 ,其结果不一样。 3. 监考施 策。 不同的老师对考生的松与严 , 看见考生作弊或违纪不勒令禁止。 4. 题目要求不清 , 学生根本无法弄清题义 , 也就无法真实的反映考生的 水平。 5. 保密工作做的不好 , 泄题事件发生。 6. 评分。主观测试的评 分常常因评卷人而异 , 难以达到较高的信度 ; 客观试卷的评分不受评 卷人的影响因此信度较高。 7. 样品数量太小 , 样本不足。 8. 身体及 心理状态不好等等 , 这些因素都会影响到信度。因此 , 为了提高信度 , 我们必须对症下药 , 采取各种措施。例如 :提供统一规范的考试环境、 规范监考、 题目必须做到明了易懂等等。
通常 , 用来检测信度最常用的有三种方法 :1. 考后复测法。 在考试 后再让学生做同一套试卷 , 如果几次考试的结果是一致的 , 这份试卷 就是有信度的。 但是在实际操作过程中 , 学生在不断的学习提高 , 而且 记忆因素也会影响复测的结果 ,因此用这一方法很难检测考试的信 度。 2. 平行测试法。 设计试卷时 , 设计两份难度一样的试卷 , 在不同的 时间给学生做 , 如果结果一致 , 则有效。但是 , 在设计试卷时我们无法 确信两套试卷在难度及内容上是否完全相同 ,因此操作起来很困难。 这种方法常用在补考试题的设计中。 3. 分半法。设计一套试题让学生 做, 然后把结果分为奇数和偶数题进行分析评判 , 并算出它们之间的 相关性。
二、 语言测试的效度
效度 , 即有效性 , 是指试题是否考了出题者想考的内容或多大程 度上考了出题者想考的内容。效度是语言测试的最重要的一个指标 , 或者说是语言测试的基本出发点 , 效度不高的测试是没有意义的。 效度可分为以下五种 :
表面效度。 表面效度就是说 , 一套试卷看起来是否合适 , 像不像 一套试卷。
具有表面效度的测试容易引起人的兴趣。 Alan Davies 曾 说, 表面信度是可以达到
的 , 但却不是必要的 , 表面的但却又是有用 的。他可以让别人相信试卷是有效的。
内容效度。内容效度是指是否符合大纲的要求 , 是否与测试目 的有关。例如 :
老师教了一个学期想看看学生对于所教内容掌握得如 何, 但是在选题时 , 所出的题目与学生学的内容无关 , 则这套试卷没内 容效度。在有内容效度的测试中考查的语言要素和技能都能有所体 现。成绩测试和诊断测试尤其要注意符合教学内容。
同期效度。 同期效度就是一次测试的结果与另一次时间相近的 有效测试的结果相比较 ,或同教师对学生的评估相比较而得出的系 数。
预测效度。它是指试卷结果是否 , 或者在多大程度上可以预测 将来的考试成
绩。
5. 结构效度。 即从理论上说 , 试卷的各个部分是否出的有道理。 结 构效度测
试是说一套测试要以一定的语言学习理论为依据。
Alan Davies 在论述语言测试的信度时说 ,信度的种类与运用有 关。 例如 :成绩
考试既要表面效度又要内容效度 ; 能力测试要有表面效 度、 结构效度和内容效度
特别依靠内容效度 ; 水平测试必须要有表面 效度、 预测效度和同期效度。 语言测
试的种类不同 , 对各种效度的要求 也就不同。语言潜能测试多基于某种语言行为理
论和语言学习理论 ,
文档评论(0)