基于VBA题库查重算法探究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于VBA题库查重算法探究

基于VBA题库查重算法探究摘要:在题库建设中,人工进行题目查重耗时,费力且错误率高。分析了题目查重的关键要素并使用Excel中的VBA编程功能和Excel对象模型实现了对题库的自动查重,对查重的关键算法和主要程序作了详细介绍。 关键词:Excel;VBA编程;题库;查重 中图分类号:TP317 文献标识码:A 文章编号:1009-3044(2012)28-6761-03 1 概述 在高校题库建设工作中,由于题库题目数量巨大,出题人在题库建设中要进行大量的添加、删除和编辑等操作,重复使用相同的题目时有发生。另外有些题库需要课程组教师联合出题,也会造成很多重复题目出现。传统解决办法是人工逐题排查,工作强度非常大。因此需要一种自动查重功能的软件,使教师或管理人员在审查时能快速准确的定位重复题目。本文介绍如何利用Excel中的VBA编程技术,实现对题库中的题目自动查重。 2 Excel VBA及Excel对象模型 VBA(Visual Basic for Application)是开发Excel应用程序的编程语言,也是内嵌于其他Office套件的应用程序开发语言]。VBA的主要任务是组织或集合Office程序的功能,虽然它无法脱离Office环境独立运行,但却在自动化工作进程、个性化工作界面等方面有着内在的优势。作为Excel中的程序语言或称宏语言,由于Excel自身强大的数据分析与处理功能,使得Excel VBA具有更广泛的应用前景。与所有其它编程语言一样,VBA编程语言也是由类型、变量、数组、函数和流程控制等基本元素组成。在Office编程环境下,所有VBA代码都位于模块中,模块是存储VBA代码的容器。模块有三种类型:对象模块、标准模块和类模块。其中,对象模块是包含对象专用代码的模块,如工作表模块和工作簿模块;标准模块用于存储公用的,共享代码的模块;类模块则可以实现基于对象的编程,创建自己的属性、方法和事件。 Excel中的工作簿、工作表和单元格等都称为对象。在Excel中,像这样的对象共有100多个,这些对象具有层次结构,如图1所示。我们可以通过对象的层次结构概念来理解对象之间的联系: 1)整个Excel的对象可以看做一个层次结构; 2)每一个对象总是处在一个特定的对象层次中; 3)除了Application对象外,每一个对象都是由高层次的对象派生出来的; 4)一个对象可以派生出其他的对象,派生出的对象处于原对象的下一个层次中。 为了在程序中有效地调用这些Excel中的对象,开发人员必须理解这个对象层次结构并熟悉每个对象在这个层次结构中所处的位置。 3 Excel题库结构及查重算法 本文研究的目标Excel题库模型包括题型、题目、A选项、B选项、C选项、D选项和答案等列。如下图所示。实际上,为了便于题库建设后根据各种需要进行抽题组卷,大部分题库都要比该模型复杂,实际的题库一般还包括章节、知识点、难度系数、性质(记忆、理解和操作等)、分值、命题人和审题人等等。 本文所探讨的是题目查重,对于选择题,查重的本质是查找题目列和各选项列是否重复,若某两个选择题的题目列和各选项列完全一致,则可标记为是重题;对于填空题或简答题,由于只有题目列,没有选项列,只要检测题目列是否有重复值即可,使用Excel2010的条件格式即可实现查重。因此,不管实际题库结构如何,查重问题可归结为图2所示的关键列,其它列对问题解决并无帮助,可忽略。本文着重探讨选择题中的单选题。由于多选题与单选题的查重方式相同,不再赘述。 下面给出针对选择题的查重算法: 第1步:在答案列后添加一列“重复标识”,用于对重复题目进行标识。设置变量rws=总行数; 第2步:设置外循环变量初始值i=2,从第2行开始逐行遍历题库; 第3步:当i=n(n=2 and n=i+1 and m=rws),将该行的题目、A选项、B选项、C选项和D选项与i行对应列进行比较,若各对应项全部相同,则i行题目与j行题目重复,将i行”重复标识”列单元格设为“Tagi”(注意,i为实际行值),将j行“重复标识”列单元格设为“与Tagi重”,并将i行和j行突出显示。否则,设置j=j+1,此时若j=rws,则重复执行第5步,否则结束内循环,执行步骤6; 第6步:设置i=i+1,若i=rws-1,则执行第3步,否则结束外循环,查重结束。 4 算法实现及主程序 下面通过部分主程序来说明查重原理。在以下主程序中,首先清除当前题目格式,并将”H”列设置列标题“重复标识”,该列将用于对重复列进行标识。变量rws用于存储题目总行数,使用变量i控制外循环,从第2行循环至rws-1行,对于外循环中的每一行i,都使用内循环遍历i+1到rws行,使

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档