在线自适应测试系统设计与实现.docVIP

下载本文档

6
0
约7.57千字
约 16页
2018-08-27 发布于福建
举报
版权申诉

在线自适应测试系统设计与实现.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

在线自适应测试系统设计与实现

在线自适应测试系统设计与实现　　摘要：针对目前计算机自适应测试系统在远程网络测试中存在的局限性，提出了基于XML的在线自适应测试系统模型。通过题目自反应理论建立计算机自适应测试模型，并提出了一种约束试卷生成的参数模型，利用增量学习算法设计了组卷策略，解决了远程网络自适应测试系统中计算量大、易造成网络交互阻塞瓶颈等技术问题。最后给出了系统的设计模型，并描述了该系统的实现过程。?? 　　关键词：题目反应理论；计算机自适应测试；在线?? 　　中图分类号：TP393文献标志码：A 　　文章编号：1001－3695(2008)01－0184－03 　　　　教育测试是进行人才选拔和能力评测的主要形式。当前考试的指导理论主要有以真分数理论为代表的经典测试理论和项目反应理论[1]两种。经过了近百年的发展，经典测试理论建立了一系列题目分析的公式，如表示难度的p值、表示区分度的题目与测试相关系数、估计分数真值的标准误差及由此推算出来的信度公式等。经典测试理论对建立试卷、考分转换和等值等均有一套较为完整的方法。但此理论仍有不够完善的地方，如考生分数和题目难度有着密切关系，即题目难度是相对考生而言的。如何使得题目参数稳定而不受受测样本影响，出现了项目反应理论。项目反应理论是以受测者回答问题的情况，经题目特征函数的运算，推测受测者的能力[2]。?? 　　根据应试者对题目的反应信息量，选择难度与应试者能力相匹配的题目，能够准确、快速地检验被测试者的能力水平，弥补古典测试理论的不足。但由于IRT实现技术上需要实时了解被测试者答题情况，并进行大量计算，实际的应用一直受到技术条件限制，一般需要计算机辅助，以IRT理论为指导建立计算机自适应测试系统。早期最著名的测试系统LOGIST、BILOG等都是单机形式。计算机　　网络技术的发展为测试理论进行大规模推广提供了技术支持。近年来测试理论的研究与实践应用取得了引人注目的发展，如美国的GMAT、TOFEL、微软的MCP等考试都采取了CAT的形式[3]。可见CAT代表着今后教育测试的发展方向和重点。本文提出的基于XML的在线CAT系统模型，解决了实时交互带来的网络带宽问题。?? 　　　　1计算机自适应测试理论与分析?? 　　　　根据项目反应理论，能力为θ的人答对题(u=1)概率为?? 　　其中：θ为受测者能力值;a为题目的区分度；b为题目的难度；　　c为题目的猜测系数；P表示能力为θ的人答对此题目的概率。?? 　　作者试题反应理论是教育测试领域中的一个重要理论。IRT的基本思想[4]是：应试者的某种潜在特质与他们对题目的反应(正确作答的概率)之间存在一定的关系，并且这种关系可以通过数学模型表示出来。IRT通过数学模型建立起了应试者能力、题目参数以及正确作答的概率之间的关系。?? 　　目前最常用的IRT模型有logistic模型。Logistic模型是1957年伯恩鲍姆提出的一种二级评分IRT模型。此模型与实际测验结果匹配较好，分为单参数、双参数以及三参数模型。单参数以及双参数logistic模型都是三参数logistic模型的特例。应试者的表现情况与这组潜在特质之间的关系可通过一条连续递增的函数来表示。该函数叫做试题特征曲线（item characteristic curve，ICC）。事实上，将能力不同的考生的得分点连接起来所构成的曲线便是能力不同的考生在某一测验试题上的特征曲线。ICC表示某种潜在特质的程度与其在某一试题上正确反应的概率。这种潜在特质的程度越高（越强），其在某一试题上的正确反应概率就越大。三参数logistic模型的题目特征曲线如图1所示。?? 　　　　其中：　　a参数代表题目的区分度，即特征曲线在拐点处的斜率，它的值越大说明题目对应试者的区分程度越高；　　b参数代表题目的难度，即特征曲线的拐点在横坐标上的投影；　　c参数代表题目的猜测系数，即特征曲线的截距，它的值越大，说明不论应试者能力如何都容易猜对本道题目。?? 　　基于IRT的测试系统在实施过程中要求实时反应，所以基于IRT理论的测试一般都借助于计算机进行。这就产生了计算机自适应测试系统。根据考生的估算能力值选择合适的题目,不断抽取与受测者能力相适应的题目是CAT的基本原则。准确估计被测者的能力水平是CAT顺利进行的前提。在测试过程中,IRT对被测者能力的估计方法一般采用极大似然估计法。通常利用IRT题库中题目的最大信息函数来确定所选择的题目。IRT用题目的信息函数I(θ)来表示题目参数与受测者能力的关系：?? 　　　　其中：θ表示受测者能力估计值；a??j、b??j、c??j分别表示第i题的区分度、难度和猜测系数。?? 　　对于不同能力的受测者，题目有不同的信息量