经典测量理论、概化、项目反应理论概述.ppt

下载文档 降价啦

75
0
约5.08千字
约 29页
2017-02-16 发布于湖北
举报
版权申诉
保障服务

经典测量理论、概化、项目反应理论概述.ppt

1、本文档共29页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

项目特征曲线有3个特点：? * 人的潜在特质量表应定义在正负无穷的区域内；被试在项目上正确作答的概率P（θ）取值在[0,1]区间之内；若题目质量好，则被试的正确作答率应随被试的特质水平的提高而提高，项目特征曲线应是一条从负无穷到正无穷的递增曲线。三、项目反应模型 * IRT?模型是一种数学模型,?它的特点是以概率的概念来解释应试者对试题的反应和其潜在能力特质之间的关系。IRT?的模型有20余种,?但比较常用的有洛德提出的著名的正态卵形模型和伯恩鲍姆提出的逻辑斯蒂模型 ?Logistic模型。这两种函数模型在计算结果上并无大的区别,?所绘制的曲线也大体相同,?然而,?在实际中大多采用后者。其中主要有以下两个方面的原因：首先是它形式上的简洁,?更具数学模型的特点；?其次是它便于用对数关系作处理,?因而模型的项目质量参数和能力参数估计起来较为方便。逻辑斯蒂模型 ?Logistic模型 ? * 由于Logistic?模型相对比较简单,?准确性较高,计算量较其他模型小,?因此在建立自适应考试系统时,?常采用Logistic?模型。由于参数的不同,?分为单参数、双参数和三参数，其中以三参数的Logistic模型最为常用,?由于计算机和网络技术的发展,?对考试的准确性的要求也越来越高,?对三参数的Logistic?模型的研究也比较成熟,?现在逐步趋向使用三参数模型。式中表示能力为的被试在项目上正确作答的概率；表示被试的能力；表示项目的难度参数；表示自然对数之底 2.71828； D表示量表因字常数 1.7；表示项目的区分度参数；表示项目的伪随机水平参数，习惯称猜测参数。 * 项目反应理论的优点： * （１）特质水平的估计可以从任何一组项目属性已知的项目中得出。（２）项目属性直接与测验行为联系在一起。（３）自变量，即特质水平和项目属性，可以不借助额外数据而分别估计。四、项目反应理论的应用--计算机自适应测验 * computerized adaptive testing（CAT）是建立在项目反应理论基础上的，由计算机根据被试能力水平自动选择测题，最终对被试能力做出估计的一种新型测验。其目的在于通过被试正确回答题目难度的高低来评价其能力，而不是像传统的纸笔测验那样通过被试能正确回答题目的多少来评价其能力。 * 与传统的纸笔测验相比，计算机自适应测验在理论上可以允许被试在任何时间进行测试，而且测试的时间要比纸笔测验所需时间明显减少。与一般计算机测验相比，计算机自适应测验可以像一般的计算机测验一样呈现试题、输入答案、自动评分、得出结果，但它所依据的理论不是经典测验理论，而是项目反应理论。能够根据被试的作答结果，自动地从大型题库中调用难度跟被试相适应、测量性能优良的试题来施测。这样，测查高水平被试时，施用的是一批难度低、性能也属优良的试题；测验不再固定，而是主动适应被试水平，灵活地“ 因人施测”。计算机在这里不再像一般的计算机测验仅仅充当 “ 媒体工具”的角色，而是充当起 “ 决策者”的角色。 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 经典测量理论 classical test theory,CTT * 1904年斯皮尔曼首次提出了经典测量理论，1950年，美国学者格立克森（Gulliksen）出版了“Theory of Mental Tests”一书，标志着经典测验理论的成熟。经典测量理论主要是以真实分数模型 true score model 为基础,围绕被试对试题的应答结果观测分数和被试所具有的真实的心理特质真分数之间存在的误差进行分析,发展并形成了包括信度、效度、区分度、等值等概念在内的比较完整的心理与教育测量理论体系,故经典测量理论又称为真分数理论。 * X T+E 任何一个测验成绩都看做是真分数和测量误差之和,这是经典测量理论的基本思想。真分数理论的基本假设：在讨论范围内,真分数具有某种程度的稳定性,即真分数不变,是常数；测量误差的期望值为0,即E 0；测量误差与真分数相互独立,真分数与测量误差相关为0；不同测量误差之间的相关为0；平行性假设:以相同的程度测量同一心理特质的测验称为平行测验。每个平行测验的平均数相等,等于同一心理特质,即真分数；测量误差的平均数相等,且等于0；测量误差方差相等。 * 根据上面的假设,可以将真分数定义为:一个被试在某一测量中无限多次测量的均值或数学期望,即经典测量理论的优点与局限性优点：在20世纪大部分年代里,心理与教育测量的理论与实践一直建立在真分数模型基础上。真分数模型是以弱假设为基础的, 采用的计算公式简