自适应通用电子考试系统设计与开发.docVIP

下载本文档

0
0
约4.4千字
约 10页
2018-09-18 发布于福建
举报
版权申诉

自适应通用电子考试系统设计与开发.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

自适应通用电子考试系统设计与开发

自适应通用电子考试系统设计与开发　　摘要：考试是教务工作中的重要一环。伴随着教育教学模式的发展，传统的考试测评手段已不适应当前的教学实践。建立高效、科学的测评考试系统迫在眉睫。本文以项目反应理论为基础，提出了一种自适应的通用电子考试系统，并对该系统的系统框架、考试流程设计、项目反应理论模型、自适应抽题引擎设计、数据安全传输等进行了较详细的介绍。　　关键词：电子考试自适应考试项目反应理论抽题引擎　　中图分类号： TP311 文献标识码：B 文章编号：1673-8454（2007）12-0031-03 　　　　一、引言　　　　在众多繁杂的教务工作中，考试测评是最重要也是最繁琐的。大到期考，小到测试，一学期各科的考试成为学校工作的重中之重。随着远程教育的发展，教育模式已发生了深刻的变革，学生不再接受集中的教学和辅导，如何对分布在全国乃至全世界各地的学生的学习效果进行测评给传统的测试手段提出了前所未有的挑战。一方面教育教学需要高效快速的考试手段提高工作效率，适应教学模式的变化，另一方面却是极其低效的人工工作方式。在测评手段上，人工出卷、阅卷不仅浪费了大量的人力物力，还存在出错率较高、难以高效实施的问题。建立高效、科学的测评考试系统迫在眉睫。　　当前，高校教学改革的主要目标之一是要改变传统的以教师为中心的教学模式，在此基础上逐步实现教学内容、教学手段和教学方法的全面改革。显然，考试测评是其改革的中心内容之一。建立一种以学生为中心，与学生能力自适应的通用考试系统是高校教学改革的一种极具意义的尝试。　　　　二、自适应通用考试系统原理　　　　通常纸质考试和传统考试都是基于经典测验理论（CCT）的。研究表明经典测验理论和方法存在若干不足：第一，项目难度和项目区分度等经典项目统计量的值依赖于施测时的特定被测样本，被测群体能力的平均值和标准差往往也会极大地影响项目统计量、信度和效度等。项目统计量样本依赖性所产生的后果之―就是只有当被测全域和得出这些项目统计量的被测样本相似时，这些项目统计量才是可用的。第二，只有施测相同（或平行）测验项目时才能对被测样本进行比较。在测试时，如果测验难度与被测能力大致匹配，测量的精度将会得到提高，但如果学生的成绩是借助非平行的不同测验得出的，那么只有经过了复杂的等值过程，分数之间才能进行比较。第三，无法预测某个特定被测样本面对某个特定项目时的可能反应。然而，如果测验设计者希望对于被测全域的测验分数特征进行预测，或希望设计具有某种特征的测验时，这种信息将是非常有用的。[1] 　　经典测验理论存在的不足促使新的测验理论不断出现，近十年来，项目反应理论开始得到愈来愈多的重视。项目反应理论（IRT）的目的是通过提供一个能力量表来克服经典测验模型的缺点，在该能力量表上，被测能力是和所施测的特定测验项目无关的。如果不考虑通常的测量误差，那么从不同难度的测验所得到的被测能力估计值将是相同的。IRT是通过把有关项目的信息与能力估计过程结合而达到估计值不变性的目的。而且，在IRT测量框架中，项目统计量与被测的能力是定义在同一量表上的。从理论上讲，项目统计量是独立于特定被测样本的。由于被测样本能力分布不影响项目的参数，因此在面对不同的被测样本时项目参数可保持不变。最后，与经典测量理论不同，IRT的测量误差是和个体能力估计值相联系的，它不会对所有的被测样本都采用单一的误差估计值。[1] 　　总之，项目反应理论模型能够提供不变的项目统计量和能力的估计值。这两个特点对于测验编制者来说是非常有价值的，这对于诸如适应性测验和题库的评价开辟了新的方向。当然，这种不变性的特点并非在任何情况下都能体现出来。只有当所选定的IRT模型和测验数据之间具有适度的拟合时，才能够得到项目和能力参数的不变性。因此，确定IRT模型和测验数据的拟合程度是极为重要的。　　目前，基于项目反应理论已经开发了许多适应性测试系统。所谓适应性测验，就是依据被试的不同水平，对不同的被试施行不同的测验项目，并使这些项目的难度和被试的水平相适应。由于与被试的水平相适应，因此这些项目能够提供关于被试能力最充分的信息，并使达到预定测试精度水平所需的测验项目数量大大减少，测验时间缩短，被试和主试的疲劳程度和工作量相应减低。[2] 　　为了使测验项目和被试的能力水平相适应，就需要事先建立起一个相当大的题库，其中各项目参数是已知的。每当被试对项目做出反应后，就对被试的能力进行估计。由于能力估计需要进行复杂的计算，用手工方式很难迅速而有效地完成，必须依靠计算机才能实现。运用计算机进行的适应性测验也被称为计算机自适应考试（简称CAT）。[3] 这种测验可以对每个被试分别进行，测验项目通过计算机终端显示出来。给不同的被试呈现不同的项目，被试