- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
教育测量与评价》课程资料试卷答案4套
第一套试卷答案
一、选择题(每题2分,共20分)
1.教育测量的核心任务是(D)
A.价值判断B.教学改进C.目标导向D.数量化描述
解析:教育测量侧重对教育现象的客观量化,评价才涉及价值判断。
2.重测信度的计算需满足(C)
A.两次测验内容完全不同B.间隔时间越长越好C.被试群体稳定D.仅适用于速度测验
解析:重测信度要求被试在两次测试间未发生显著变化,间隔通常2-4周。
3.内容效度的评估主要依赖(B)
A.统计分析B.专家判断C.效标关联D.因素分析
解析:内容效度考察测验内容与目标的匹配度,需领域专家进行逻辑分析。
4.某数学测验P值为0.65,说明该题(A)
A.难度适中B.难度较高C.难度较低D.区分度良好
解析:常模参照测验中,P值0.5左右难度最佳,0.65属适中范围。
5.项目反应理论(IRT)的核心假设是(D)
A.测验总分服从正态分布B.题目难度与被试能力无关C.误差方差恒定D.被试对题目的反应概率与能力参数相关
解析:IRT强调被试能力与题目参数的函数关系,突破了经典理论的样本依赖性。
6.标准参照测验的关键技术是(C)
A.常模建立B.区分度优化C.分界点确定D.信度提升
解析:标准参照测验需明确“掌握/未掌握”的临界分数,即分界点。
7.教育评价的本质属性是(B)
A.测量的延伸B.价值判断C.数据统计D.目标达成度检验
解析:评价是在测量基础上对教育现象的价值分析。
8.克龙巴赫α系数主要反映(A)
A.内部一致性信度B.评分者信度C.复本信度D.稳定性信度
解析:α系数用于计算多题测验的同质性信度。
9.表现性评价的核心特征是(D)
A.客观计分B.标准化程序C.短时完成D.真实任务情境
解析:表现性评价强调在实际任务中观察学生综合能力。
10.教育测验编制的首要环节是(C)
A.题目编写B.试测分析C.明确测量目标D.制定双向细目表
解析:目标导向是测验编制的基础,决定后续所有环节。
二、简答题(每题8分,共40分)
1.简述教育测量与教育评价的区别与联系。
区别:测量是对教育现象的数量化描述(如分数),评价是基于测量结果的价值判断(如“优秀”“合格”);测量侧重客观性,评价具有主观性;测量是基础工具,评价是应用过程。
联系:测量为评价提供数据支撑,评价需依赖测量结果;二者共同服务于教育决策,测量的科学性影响评价的准确性。
2.如何通过项目分析筛选优质试题?
(1)难度分析:计算P值(通过率),常模参照测验保留P=0.3-0.7的题目,标准参照测验根据目标调整。
(2)区分度分析:计算D值(高分组与低分组通过率之差),保留D≥0.3的题目,D0.2需修改或删除。
(3)选项分析:检查干扰项是否有效(高能力组少选错误选项,低能力组多选),删除无区分度的干扰项。
(4)猜测可能性:分析二选一题目是否因猜测影响效度,必要时调整选项数量或计分方式。
3.简述效度验证的主要方法。
(1)内容效度:专家评估测验内容与目标的匹配度,可通过内容效度比(CVR)量化。
(2)效标关联效度:计算测验分数与效标(如学业成绩、教师评价)的相关系数,分同时效度(当前效标)和预测效度(未来效标)。
(3)结构效度:通过因素分析验证测验是否测量了理论假设的结构(如智力测验是否反映言语、逻辑等维度)。
(4)聚合效度与区分效度:与同类测验高相关(聚合),与异质测验低相关(区分)。
4.论述常模参照测验与标准参照测验的差异。
(1)目的不同:常模参照侧重个体间比较(如选拔考试),标准参照侧重个体与目标的比较(如毕业考试)。
(2)结果解释:常模参照用百分等级、标准分等相对位置表示,标准参照用“掌握/未掌握”“达标率”等绝对标准表示。
(3)题目要求:常模参照需题目有区分度(P=0.5左右),标准参照需题目覆盖目标内容(P可接近1或0)。
(4)常模需求:常模参照需定期更新常模数据,标准参照需明确界定“掌握”的行为标准。
5.简述教育评价的主要功能。
(1)诊断功能:识别学生学习困难、教学薄弱环节(如通过试卷分析发现“函数应用”普遍失分)。
(2)导向功能:引导教学目标落实(如评价关注核心素养,则教学会加强实践能力培养)。
(3)激励功能:通过反馈激发学生学习动机(如进步性评价强调个体成长)。
(4)管理功能:为教育决策提供依据(如区域教育质量监测结果用于资源分配)。
(5)发展功能:促进教师专业成长(如通过评价反思改进教学策略)。
三、论述题(20分)
结合中小学学业考试改革,论述标准参照测验在教学中的应用价值及实施难点
文档评论(0)