- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章 测试与测试理论 本章学习要点 本章内容结构 ? 第一节 测试的意义与分类 测试的目的: 是实现个人、集团的技能、 知识、能力与适应性的测定。 狭义测试:针对具体的技能、知识、能力适应性的测试; 广义测试:针对心理特性的测试。 测试与评价的关系。 测试的分类: 一 机器测试与传统测试 1 机器测试 机器:收音机、录音机、电视机、计算机等 测试功能:主要用于智能测试和适应性测试 2 传统测试 测试工具:纸张(笔试) 测试功能:主要用于学力测试和各种心理测试 二 客观测试与主观测试 1评分的客观性 即测试的评分不会因为评分者不同而不同 2客观测试 题型,是非判断题、多重选择题、匹配题等; 评分标准:明确、客观。 3主观测试 题型:客观题型以外的有关题型,如问答题、论述题、求解题甚至填空题; 评分标准:模糊、主观。 三 综合测试与分析测试 1 综合测试 测试目标:只有一个; 测试目的:综合评定其教育价值; 实例:课程期末考试、学生升学考试、培训结业考试、全民公决等。 2 分析测试 测试目标:多个; 测试目的:分别评定其教育价值; 实例:多个单元测试、多个候选人竞选等。 四 标准测试与非标准测试 1 标准测试 基础:具有测试相同特性的标准题库(分数等值); 理论:IRT理论(见后); 适用:大规模的同一(统一)测试、评价。 2 非标准测试 基础:个人根据某项要求设计的小型测试(分数通常不等值); 理论:CTT理论(见后); 适用:小规模的分散测试、评价。 五 集团基准测试和达到基准测试 1 集团基准测试(NRT:Norm Referenced Test) 定义:测试被试集团的统计性质; 计算项目:频度分布、平均值、方差、标准差等; 测试结果:集团的相对性。 2 达到基准测试 (CRT:Criterion Referenced Test) 定义:测试被试达到某种基准的程度; 计算项目:被试的正答率(得分)等; 测试结果:个体的绝对性(达到或未达到)。 第二节 测试数据的统计测度 一 平均值、方差、标准差 1 平均值(被试人数为N) 2 方差 方差表示各个被试得分的分散程度。 3 标准差 它是方差的开平方 ? 二 协方差和相关系数 2 相关系数 (1)用协方差表示多个测试间相关程度的困难:P113 (2)相关系数 现有被试人数为N,每人经两门课程测试,其得分为: xi , yi(i=1 , 2 ,,,, N) 第三节 测试数据应具备的特性(经典测量理论) ?经典测量理论 (CTT: Classical Test Theory) 1??? CTT的三个假设: ①测验的观察分数X,可看作真分数T和测验误差分数E的线性组合,即:X=T+E ; ②误差分数的数学期望为0; ③任何两次测验所产生的误差相互独立。 ?2??? 经典测量理论研究的问题 ①个体:难度、区分度; ②团体:信度、效度 一 测试的误差模型 1 测试误差的产生 2 测试得分 xi=ti+ei 3 误差的平均值 (改错) 6 测试得分的方差(两项之和) 二 测试的精度与信度 1 测试的精度(一致性) 2 信度系数 定义:真值的方差与测试得分方差之比,即 ?? 三 信度系数的估算 1 再测信度 (1)定义:用同一份试卷先后两次对被试团体进行测量,求其相关系数(跨时间的一致性:又称为稳定性系数) (2)计算公式: ? 即用相关系数表示其信度系数。 (3) 应用:时间间隔的确定 2 平行测试法(复本信度) (1)定义:根据同一被试团体在两个等值测验(两套等值试卷)上的得分,计算其相关系数 说明:P116 (2)计算公式:同再测信度 (3) 应用:关键是设计两套试卷。 1?内容的妥当性(内容效度) (1)定义:是指测验项目对欲测的内容或 行为范围取样的适当程度 (2)应满足的两个条件: 取样的覆盖范围合理、适当; 所选项目是该范围的典型代表。 (3)确定内容效度的方法 专家判断法(定性的方法); 再测法:在教学之前先测验一次,在教学之后再测验一次 2 基准关联的妥当性(效标关联效度、统计效度、准则关联效度) (1)定义:以某一种测验分数与其效标分数之间的相关程度 (2)效标:能够显示或反映欲测量的属性的变量 (3)计算方法(计算其相关系数) 3构成概念的妥当性(构想效度、构造效度) (1)定义:是指测验对理论上的构想或特质的测量程度,它是克伦巴赫等人在1954年提出的。 (2)?? 步骤: 从某一理论出发,提出关于某一心理
您可能关注的文档
- 特殊的保护特殊的爱31419.ppt
- 同位旋非对称核物质性质与扩展的BHF方法(Ⅰ)同位旋相关的扩展的BHF方法.pdf
- 投资分析课件8.ppt
- 胃癌患者血清Her-2_neu+ECD水平与肿瘤组织Her-2_neu表达的相关性及与临床特征的关系.pdf
- 我的富营养化课件.ppt
- 我国房地产企业融资现状及对策研究(修改).doc
- 小鼠白细胞介素18在大肠杆菌中的表达、纯化及抗肿瘤作用研究.pdf
- 杨署东《国际问题与法律》课件6——美国的人权双重观与国际人权问题.ppt
- 伊马替尼联合化疗治疗Ph染色体阳性急性淋巴细胞白血病的分子学疗效与预后因素分析.pdf
- 移动自组网中基于声誉机制的安全路由协议设计与分析_王建新.pdf
文档评论(0)