教育测量与评价课件13第十三章现代教育测量与评价的发展趋势.pptVIP

下载本文档

137
0
约2.59千字
约 8页
2017-06-04 发布于广东
举报
版权申诉

教育测量与评价课件13第十三章现代教育测量与评价的发展趋势.ppt

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

教育测量与评价课件13第十三章现代教育测量与评价的发展趋势

第十三章　现代教育测量与评价的发展趋势经典测验理论的特色现代测验理论的优势现代教育测量与评价的发展趋势经典测验理论的主要优点经典测验理论的主要局限性题目反应理论的主要优点题目反应理论的主要局限性经典测验理论与现代测验理论的比较现代教育测量与评价的发展趋势（一）现代教育测量与评价的发展趋势（二） * （1）经典测验理论是以弱假设为基础的，这弱假设条件容易被绝大多数测验数据资料所满足；（2）经过几十年的发展，经典测验理论形成一套以真分数理论为基础的较完善的测验理论和对题目与测验进行统计及分析的方法，且这些方法在计算上较为简单，意义上也直观明了，易被教育工作者理解和掌握，所以应用上具有普遍性；（3）我国教育工作者在使用过程中和实践中不断形成和完善了一套适合国情的具体应用方法和应用原则。（1）经典测验理论的统计分析方法得到的各项指标，依赖于特定的被试样本；（2）在经典测验理论的条件下，题目参数和考生得分是在不同的基础上分别求得的，所以经典测验理论无法建立考生得分与测验题目参数之间的函数关系。即考生能力的估计会由于测验的改变而改变；（3）经典测验理论中两个相当重要的假设条件——严格平行测验和误差与真分数不相关，在实际操作上是难以做到的。（1）题目难易度的估计不因样本不同而不同；（2）考生能力的估计不因测验的改变而改变；（3）测量误差的估计因考生程度不同而不同；（4）为多种形式测验的实施提供了更为完善的理论和方法。（1）对数学模型与实测数据的似合要求较高。在实际应用中我们发现，实测数据与模型拟合，也会收到考生样本容量大小及题目数量多少这两个因素的制约。所以使用题目反应理论时，还必须对拟合度作统计检验。此外，拟合度还与所选择的模型有关。（2）题目反应理论是一维性假设，是对任何数学模型的共同假设，这是测验编制者希望提高测验分数的可解释性。但到目前为止，尚没有一种能验证一维性假设的方法。（1）参数稳定性：经典测验理论使用的题目分析法所得的题目统计量数受样本的抽样影响较大。现代测验理论IRT的方法具有局部独立和参数独立等特点。题目参数估计是独立于被试样本和题目样本。（2）能力的比较：经典测验理论对被试能力间的比较只能在相同的测验或平行复本的情况下进行，一般成就测验和性向测验较适用于中等能力的被试，对于能力较高或较低的被试，估计时就不太准确。测验的题目难度如能适合被试的能力水准，这样有益于提高测验的效度；也即是说，即使减少测验的题目数也不会降低测验的效度。难度与能力的配合了是经典测验处理的困难之一。而现代测验IRT是自适性测验或电脑自适应测验，它是处理较方便且灵活。用经典测验理论的方法与程序处理能力比较是会产生许多困难。（3）平等复本难实现：经典测验理论是基本的概念是测验的信度。而信度的设定来自平行复本的假设。但事实上理行测验是很难达到的，被试不可能在两次测验中得到完全相同的结果。经典测验理论常依赖平行复本的假设，所以研究者在现实实施中只能接受下限的信度估计或具偏差的信度估计。（4）缺乏预测力：经典测验理论无法预测被试在一个新测验中可能的表现。如果测验与被试的能力水平一致就能得知被试答对某时题的概率，那么测验的编制者就可以根据项目的概率来预测某些群体的得分情况。（5）测量标准误：经典测验理论是假定所有被试的测量标准误都是相等的。事实上，不难发现，不同能力组表现在测验上的稳定性是不同的。良好的测验模式应能针对某一测验得分或被试能力理行精确的估计，不同的得分或能力有其不同的概率误差，而非统一的测量标准误。（1）教育测量与评价的政治性得到加强由于社会发展要求深化教育改革，并且需要对教育改革的成效作出正确的评价，这就使教育测量与评价的地位得到提高。人们对教育测量与评价提供的资料也寄予了更大的希望，从而使教育测量与评价产生更大的政策性督促作用。政策制定者们寻求加强教育说服力的途径，由此对教育测量和评价发生了新的需求和期望。现代教育测量与评价不仅只是为了评价学生，而是转向了测验资料的多方面利用，尤其是在课程评价、办学评价、教学评价、教师评价等方面的作用日益受到关注。（2）教育测量与评价的教育功能得到强化在教育实践中，人们提高了学业成绩测验、能力测验的地位，更强调诊断性测验，而相对冷落了能力倾向测验。能力倾向测验只是一种预测，一个人的潜在能力能否在将来完全实现很难确定，但其结果往往使教育工作者们忽视那些在能力倾向测验中表现不佳的学生，而重视那些表现较好的学生，这样做并不符合教育的真正目的。目前人们更关心的是学生已发展的能力，已显示的才能以及已获得的知识，也更关心教与学中存在的问题。测验在此越来越多地显示出诊断和补救的作用。（3）