- 1、本文档共51页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 项目分析;本章主要内容;;第一节 项目的难度分析;一、定义;二、估计测题难度的方法;随堂练习; 2、当人数较多时,对于选择题、是非题等二级计分的题目,我们也可以用极端分组法。先根据被试的测验总分把他们由高到低排序,然后在两端分别截取人数比例相等的(一般取27%的比例)高分组和低分组,分别计算两组被试在某个项目上的通过率,求其平均数作为该题目的难度指标:
; 3、对于二级计分的题目,如选择题、是非题,被试有猜题(凭机遇答题)的可能,对于一个二重选择题,能力为0的被试仍有50%的可能性选择正确答案。对K重选择题,被试完全凭机遇答题而得到正确答案的可能性是1/k。
鉴于机遇对选择题的影响,其实际难度与使用难度公式(P=R/N)计算的难度就有一定的差别,因此必须进行矫正。校正公式是:
; 另外,这个公式在选择题的备选答案数互不相同,又要比较它们的难度时特别有用。
例题:一个五选一的测题的难度指数是0.50,一个四选一的测题的难度指数是0.53,问哪一个测题的难度大?; 4、在心理测验中,有些量表是多级计分的,比如许多心理量表中常用5点计分法:从未有过、偶尔、有时、经常、总是,并分别给予1分,2分,3分,4分,5分。在学科测验中,像简答、论述等主观性试题,也是按照评分标准对正确的部分给予一定的分数。像这种非二级计分的测题,可用下列公式计算测题难度:
;5、项目难度的等距量表
使用项目难度等距量表的理由:
⑴测题的难度一般用答对某题的人数的百分比表示。百分量表是等级量表,而非等距量表。也就是说它只表示事物之间大小的关系,但没有相等的单位。用百分比P值作为难度指标,实际上是在顺序量表的水平上衡量题目的难度。
⑵难度的等级量表是反序而行的,P值越大,项目越容易,这与我们的日常概念是相反的。
;; P=0.5时,对应的Z=0,P=0.6时,对应的Z=-0.25,P=0.7时,对应的Z=-0.52.前两个Z值相差0.25,后两者相差0.27,显然差距是不相等的。
由于Z分数的值有正有负,使用起来有诸多不便,为此美国教育测验中心(ETS)创立了一个量???,用希腊字母△做单位 :
△=13+4Z
标准正态分布的全距一般包括6个标准差的距离,即从-3到+3,所以等距难度指数△量表的全距是1至25,平均数是13,标准差为4.; P=0.9987时, Z=-3 , 故Δ=13+4(-3)=1
P=0.9772时, Z=-2 , 故Δ=13+4(-2)=5
P=0.8413时, Z=-1 , 故Δ=13+4(-1)=9
P=0.5000时, Z= 0 , 故Δ=13+ 4(0) =13
P=0.1587时, Z= + 1 , 故Δ=13+4(+1)=17
P=0.0228时, Z= + 2 , 故Δ=13+4(+2)=21
P=0.0013时, Z= + 3 , 故Δ=13+4(+3)=25
由此可见,常用的Δ值域介于1-25之间,Δ值越大,试题越难; Δ值越小,试题越容易。;;三、测验的难度对测验的影响(P207);2、测验的难度会影响到测验的信度和效度。
测验的难度过大或过小会使测验形成正偏态和负偏态,与正态分布相比,分数的离散程度都会变小,导致信度降低。
信度低了会导致效度降低。另外心理特质的分布大多是正态的,只有当测验的平均难度是0.5时,测验分数的分布才会是正态,两者才能相互吻合,只有当测验分数的分布与心理特质的分布相吻合时,测验才能对不同心理特质水平的被试有最大的鉴别力,测验的效度才能达到最高。;四、测验难度水平的确定;⑵从测验的性质上看
无论难度测验还是速度测验都要防止被试得满分,因为难度测验是考察被试的最高能力水平,速度测验是考察被试的最快反应速度。如果被试在这些性质的测验上得满分,我们就很难确定倘若题目比现在更难更多一些,被试将比现在多得多少分。
因而,在速度测验中,题目的难度不应超出被试的能力水平,但题目的数量必须多到反应最快的人在规定时间内也做不完的程度,这样才能真正测出被试的反应速度。在难度测验中应该包括各种不同难度的题目,其中最难的题目几乎是所有被试都回答不上来的,这样在时间比较宽裕的条件下,才能真正测出被试的最高能力水平。;第二节 项目的鉴别力;一、定义;二、项目鉴别力的估计方法;美国教育与心理测量学家艾伯根据鉴别力指数提出了一个评价题目优劣的标准;;;;随堂练习;;随堂练习;;随堂练习;;;;;
文档评论(0)