- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
余仁胜《题目难度浅析》.doc
余仁胜《题目难度浅析》 题目难度是反映试题特征的一项重要指标。题目难度顾名思义就是题目的难易程度,反映题目难易程度的指标称为题目的难度系数,有时简称为题目难度。根据测量理论的不同,计算难度系数的方法也不同,我们所常见的难度系数主要有题目正确作答率、△难度和利用题目反应理论估计的题目难度等。 1.经典测量理论(CTT)的题目难度的概念 题目的难易程度是因人而异的。一个简单的例子是:1+1=?。对所有小学以上水平的人来说,作出正确回答是不言而喻的,但对于一个对数字还不了解的婴幼儿来说,就很难。任何一道试题对于本领域的专家来说是易的,而对于外行来说便是难题。这说明题目难易程度是相对的而不是绝对的。 经典测量理论是通过试题的得分率或答对率作为难度定义的,又称为题目的正确作答率。在每次考试以后,为了了解考生对试题的作答情况,需要进行试题分析,其中一项重要内容就是统计本次考试中每一道题有多少考生做对,有多少考生做错,或者说平均得分情况。在这次考试中平均得分高的试题较易,平均得分低的试题较难。为了对各题难易程度进行比较,在题目分析中一般就用题目的得分率或题目的答对率作为比较题目难度的依据,这也就是经典测量理论中题目难度定义。 我们用P+表示题目难度,则P+= ,其中R是考生在该题上的平均得分,N是该题的满分。0≤P+≤1。其难度值的范围在0-1之间,难度值愈大,表明题目的得分率愈高,试题愈容易,反之,难度值愈小,表明题目的得分率愈低,试题愈难。其优点是意义直观,便于理解,在命题中便于专家控制,在题目分析中,可比较直观地反映各种类型试题得分情况和题目难易程度。其缺点是题目的难度系数与考生样本水平直接相关,考生群体变化、题目的难度系数变化,难以实现题目参数的等值。 经典测量理论题目难度是主客观相互作用的结果。主观主要体现为考生群体的水平,客观主要体现在试题考查内容的深度、广度以及问题解决复杂程度。当考生群体水平没有发生变化时,试题间难度值的差异反映试题考查内容的深度和广度的差异或不同;考生群体水平发生变化时,试题难度值反映考生水平的变化或差异。正因为如此,试题难度的预测必须建立在预测群体水平与实考群体水平大体一致的前提下,否则,所估计的题目难度意义不大。 2.题目难度与认知层次的关系 题目难度和认知层次是衡量试题质量的两个重要指标。它们之间既相互区别又相互联系。题目难度是指试题的难易程度,而认知层次是在认知领域根据诸多教育(考试)目标之间的共同特征或内在联系把教育(考试)目标分类的结果。由此可知,题目难度和认知层次完全是两个不同的概念,切不可将它们混为一谈。这是二者之间的区别。 它们之间也有联系。通常我们采用B·S布鲁姆的分类法,把教育(考试)目标置于一种有层次的框架之中,在认知领域,这些层次按照从简单到复杂,由低级到高级的顺序排列。其中,后一个层次比前一个层次包含更复杂、更抽象或更高的要求,或者说,前一个层次是后一个层次的基础,后一个层次是在前一个层次基础上的提高或发展,因此,一般情况下,认知层次高的试题,其难度也较大,或者难度大的试题,其认知层次也较高。这是二者之间的联系。 但是,难度和认知层次毕竟不是同一概念。事实上,不同认知层次的试题,特别是相邻认知层次的试题,其难度是相互交叉的。譬如:属于领会类别的大难度试题往往比运用(应用)类别的小难度试题其难度要大,这在考核不同的知识内容的试题中是常见的。 综上所述,在命制试题和组配试卷的过程中,难度和认知层次的作用是不可相互替代的,二者缺一不可。 3.命题过程中试题难度的控制 对于大规模考试而言,比如高考、研究生考试等,保持历年间同一课程的试题难度的稳定是非常重要的,能否有效控制试题难度是命题水平的重要标志。由于在大规模考试中不同年份间考生群体水平是相对稳定的,此时,经典测量理论的题目难度是很有价值的,因为同样试题在不同年份考试中统计的难度值基本一致。我们对研究生数学考试的试题进行过研究,发现同一类型的试题在不同年份或同一年份不同试卷中出现时得分率大致相同,同一试题在不同的试卷中使用得分率基本一致。这说明对于考生水平相对稳定的考生群体而言相同试题的得分率也相对稳定,这是我们命题活动中控制题目难度的理论基础。 由于大规模考试试题保密要求很高,一般不通过普通的试测方法估计题目难度,而是充分利用命题专家组多年命题的经验并参照往年题目难度数据预估各题的难度值,并通过控制试卷平均分的办法,来实现控制整份试卷的试题难度目标。其方法是,首先估计题目的难度值,然后将每题的题分乘以该题的难度,然后相加即得到该卷的估计平均分。如果估计平均分与期望达到的平均分基本一致,则这份试卷难度水平是合格的。不然的话,则通过修改试题,改变试题难度的方法使试卷的估
文档评论(0)