数据挖掘技术在试卷分析中的应用 - 图文-.doc

数据挖掘技术在试卷分析中的应用 - 图文-.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
西南民族大学学报·自然科学版第34卷第4期 Journal of Southwest University for Nationalities ?Natural Science Edition Aug. 2008___________________________________________________________________ ___________________________ 收稿日期: 2008-03-11 文章编号: 1003-2843(200804-0839-04 数据挖掘技术在试卷分析中的应用 张瑶, 陈高云, 王鹏 (1.成都信息工程学院计算机系并行计算实验室,四川成都, 610225;2. 成都信息工程学院软件工程系并行计算实验室,四川 成 都,610225;3. 成都信息工程学院软件工程系并行计算实验室, 四川成都610225 摘要: 本文讨论了数据挖掘技术在试卷分析中的应用, 针对传统试卷评价方法中仅仅是对试卷进行宏观整体的分析与 评价,缺乏对特定试题评价的局限性,本文利用了层次聚类技术和关联规则技术对学生试卷进行分析, 得到了具有不同成 绩特征的学生群体, 析出试卷上特定题目知识点间的相关性, 得到的结论对高校教学有一定的指导作用. 关键字: 数据挖掘技术 聚类 关联规则 试卷分析 中图分类号:TP274 文献标识码: A 1 引言 试卷分析是评估教学质量的一个重要途径,它既是检查学生把握课程综合知识能力的重要途径,也是检验教师教学质量和教学效果的具体体现, 试卷分析所反馈的信息往往能为教学工作提供更有效的帮助. 然而, 若想成功地从大量试卷中获得有用的信息, 便必然需要一种高效的数据处理方法. 在这种情况下, 数据挖掘技术发挥了它独特的优势. 2 数据挖掘技术在试卷分析中的应用 2.1 用凝聚的层次聚类技术将学生群体分类 2.1.1.学生群体的初始数据 为了清楚有效地用凝聚的层次聚类技术将学生群体分类, 本文在某高 校的数据结构课程的成绩库中选取了一部分学生成绩作为实验数据, 对其 分析, 从而得到分类群体, 进一步分析每个群体中学生的特征. 本文选取 了数据结构试卷中的大题进行研究, 在对试卷、试题难度进行严格分析后, 大体分成三类, 即: 基础题、中等题、提高题. 本文只列出了其中21个数 据, 如下表所示: 2.1.2聚类过程分析 本文采用spss 软件处理数据, 由于其高效的处理数据能力, 避免了手 工易出错的缺点. 在数据处理过程, 采用了对距离的测量方法Squared EuclideanDistance, 公式是: ,(y x EDULID = 2(i i i y x ?∑. 表 1 学生成绩表 西南民族大学学报·自然科学版 采用凝聚的层次聚类结果如下: 图1聚类结果树型图 上图是聚类结果的树型描述, 可以看出在第一步中, 观测量12和17先聚在一起, 在树型描述中, 聚类结果 更为明显. 2.1.3 聚类结果分析 由聚类结果可以看出, 这21名学生可以聚成6类: 第一类是学号为{2005001, 2005006, 2005007}的学生, 特点是基础题, 中等题, 提高题这三种题型得分数都很高. 第二类是学号为{2005012, 2005017, 2005020, 2005010, 2005013, 2005025, 2005021, 2005002, 2005018}的学生, 特点是基础题成绩比较好, 中等题成绩一般, 提高题成绩比较差. 第三类是学号为{2005003}的学生, 特点是基础题和提高题成绩都很高, 但中等题成绩比较差. 第四类是学号为{2005005, 2005008, 2005009, 2005011, 2005016}的学生, 特点是基础题和中等题成绩比较好, 提高题成绩一般. 第五类是学号为{2005014}的学生, 特点是基础题, 中等题和提高题这三种题型分数都很差. 第六类是学号为{2005014, 2005019}, 特点是基础题和中等题成绩一般, 提高题成绩差. 在本文聚出的六类中, 第二类有9个学生, 占多数, 第一、四、五类学生数量分布均横, 第三、六类学生占少数, 这与实际情况基本相符. 2.1.4聚类结果的指导作用 第4期 通过对学生成绩的聚类, 可以清楚的看到这一部分学生成绩的分布情况, 教师可以根据聚类结果对各类学生进行辅导, 学生成绩便能提高的更快更好. 例如在本文中, 第二类学生的基础题 和中等题成绩都不错, 只是提高题成绩比较差, 说明他们基础很好, 只是缺少一些 做难度高的题的技巧性, 教师可以适当的让这类学生多做一些技巧性高的题, 以 提高这方面的能力, 他们进步的速度会比较快;第三类学生的基础题

文档评论(0)

559997799 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档