- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
基于遗传算法的自动组卷研究与应用
?
?
施俊+缪勇
摘要:随着在线考试系统的广泛应用,组卷算法决定了自动组卷的性能。为提高组卷成功率,提出基于遗传算法的自动组卷模型,根据总分、题型、难度、区分度等要求建立多目标、多约束条件的数学模型。采用ASP.NET编程实现,并进行编码、选择、交叉、变异等操作,使遗传算法能满足自动组卷要求。
关键词:在线考试;自动组卷;遗传算法;数学模型
:TP301:A:1009-3044(2014)34-8160-03
随着信息化建设的推广,在线考试系统成为教学考试的有效补充,一份组卷质量高的试卷,能够准确评价学生的学习情况,在考试系统中,组卷主要分为手动组卷和自动组卷。自动组卷是指利用组卷策略从试题库中抽取试题,组成一份符合总分、题型、难度、区分度等约束条件的试卷,组卷算法设计决定了组卷的质量和效率。研究智能组卷算法,设计出合理的组卷算法一直是当前研究的热点和难点。
常用的自动组卷算法有:随机法组卷和回溯法组卷,对于求解复杂度较高或试题量较大时有明显的缺陷。采用遗传算法(GeneticAlgorithm,GA)实现自动组卷可取得较好的效果。该文利用遗传算法作为智能组卷问题的策略,并将该算法应用于在线考试系统的自动组卷中。
1组卷理论与数学模型
1.1质量指标选择
在教育测量学理论中,有“难度、区分度、效度、信度”指标体系,分别代表统计中的百分数、平均数、相关系数、标准差结果[1]。在组卷操作之前进行分析,确定试题应包含哪些属性。
1)试题难度,指完成某条试题时,所面对的困难程度,通过在该题上的失分率来体现。
试题i的难度系数Ei公式为:Ei=1-Ri/Ki
其中,Ri为试题i的平均得分值,Ki为试题i的分值。
2)试题区分度,指对不同层次学生的鉴别能力大小的指标,用通过该试题测试和未通过该试题测试的学生的平均分值和该试题的满分值来计算。
试题i的区分度Di公式为:Di=(RH-RL)/Ki
其中,RH表示通过该试题测试学生的平均分值,RL表示未通过该试题测试学生的平均分值,Ki为试题i的分值。
在最初建立课程试题库的时候,就准确确定好试题的难度和区分度是困难的,教师往往根据经验设置一个初始值,而后根据学生的考试情况逐年进行修正。
3)试卷信度和效度
试卷信度是指测试结论与数据的可靠性程度,试卷质量稳定性和可靠性通过试卷信度来衡量;试卷效度是指试卷内容与教学大纲的吻合程度[2]。
1.2自动组卷的数学模型
自动组卷是指从相应的试题库中抽选出符合约束条件的试题组成试卷,并且需要满足总分约束,题型约束、题量约束、难度约束、区分度约束、分值约束等多个方面的要求。
假设一份试卷包含m道试题,每道题有n个属性,则生成一份试卷就可用m×n矩阵表示,即:
1)试卷总分约束,[S=i=1mai2],[ai2]表示第i道题的分值,S是由用户设定试卷的总分,默认满分为100;
2)题型分值约束,[Tt=i=1mC1i×ai2],其中,[C1i=1(ai2=t)0(ai2≠t)],t表示题型号,[Tt]表示第t种题型所要求的分数,[C1i]表示单择、判断、多选、填空、分析、简答、计算等题型;
3)章节分值约束,[Zt=i=1mC2i×ai2],其中,[C2i=1(ai2=t)0(ai2≠t)],t表示章节号,[Zt]表示第t章所要求的分数;
4)知识点分值约束,[ZSt=i=1mC3i×ai3],其中,[C3i=1(ai3=t)0(ai3≠t)],第t个知识点分值;知识点覆盖面为:[R=已选的知识点数应包含的知识点数≥r],一般情况下,为了使知识点覆盖面广,这里r取80%较为适宜;
5)难度约束,[E=i=1mai2ai4S],其中,[ai4]为第i道试题的难度,[S]为试卷的总分;
6)区分度约束,[D=i=1mai2ai5S],其中,[ai5]为第i道试题的区分度,[S]为试卷的总分;
1.3组卷目标函数
组卷是多目标条件的组合优化问题,生成一份质量较好的合格试卷,需要满足题型、分值、难度、区分度等多方面条件的约束,同一个解通常无法同时达到多个目标最优,故为每个目标给定一个权重,进行累加后生成一新的目标函数:[F(x)=i=1nwifi(x)],其中,[fi(x)]为对应[ai]属性对组卷约束的误差,[wi]为第i项组卷因素在组卷中所占权重。
在实际组卷中,较理想的状态是实际各指标的满足率与理论上各指标的满足情况的差异尽量最小,即偏差值最小,因此目标函数可以表示为min[F(x)];一般情况下,试卷的约束条件很难做到同时满足,应该合理设置权重,优先考虑一些重要指标。
2遗传算法的自动组卷模型与应用
遗传算法
文档评论(0)