数据挖掘在中学考试中的应用研究.docx

数据挖掘在中学考试中的应用研究.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘在中学考试中的应用研究 在该系统的开发中,集成了olp分析和挖掘技术的数据仓库解决方案,用于数据存储分析和评估研讨会结果。 考试院现有基本数据以文本形式、Excel文件、oracle文件形式存在,这些构成了以OLAP分析为目的的数据仓库的异构数据源。为方便数据挖掘,通过识别、转换、数据导出/导入等手段把统一整理好的数据加载到SQL 2005 BI STUDIO以备挖掘。 针对要分析的变量,运用聚类和关联分析两种挖掘算法建立数据挖掘模型。已采集到的会考成绩里,总计有16个科目。如果想评价学校的全面教育情况,则需要在建模时将所有课程加入到挖掘模型中进行研究。 在实际挖掘中我们会发现,像体育、信息、艺术、物理实验、化学实验、生物实验、劳动技术等科目如果和其他科目放在一个挖掘模型里,在做聚类和关联分析时需要处理的数据量太大,而且会影响聚类和关联分析后的效果。联系到实际教学过程中,这些课程并不占有重要地位,因此在实际挖掘时已考虑将这些去除掉,创建了比较实用的会考成绩评价模型U nion_cluster及Union_Association,包含语文、数学、外语、政治、历史、地理、物理、化学、生物等科目,分别用于聚类分析和关联规则分析。 其中的关联规则分析模型为: 另外,针对高考的指挥棒现象,我们在系统当中也考虑到了会考以后文理分科的问题,为了使得会考成绩分析后能更加有效的反馈于教学,服务高考,在建立挖掘模型的时候又针对文理进行了分类,其中文科成绩挖掘模型Arts_cluster及Arts_Association含语文、数学、外语、政治、历史、地理(文综)等科目,分别用于聚类分析和关联规则分析。 理科成绩挖掘模型Science_cluster及Science_Association,含语文、数学、外语、物理、化学、生物(理综)等科目,分别用于聚类分析和关联规则分析。 其中利用聚类分析的理科成绩挖掘模型Science_cluster为: 数据处理与模型评估 (1)聚类算法: 以市、区、学校或班级为处理单元,根据考生主要科目成绩,对考生进行聚类分析,可以将学生划分成不同的类别,依次观察不同群体学生体现出的特点。 以美亚学校的考生为例,选用会考成绩评价模型进行聚类分析,可得到图1的学生聚类图。 (2)关联规则挖掘算法: 通过取得的结果分析,我们可以发现这样一些规则: 1.物理=优地理=优→语文=优 2.政治=优物理=优→数学=优 3.外语=及格化学=及格→数学=及格 4.生物=优历史=及格→语文=及格 5.物理=优历史=及格→语文=及格 把这些分析与中学教学结合起来,应用到实际,与教育上的一些基本现象吻合: 1.优秀的同学文科、理科成绩都会比较好 物理=优地理=优→语文=优 政治=优物理=优→数学=优 2差生的各科成绩都不理想 外语=及格化学=及格→数学=及格 3.各科目成绩不一的同学,也就是通常我们所说的偏科生里,科目之间会存在某种关联关系,以语文成绩为例: 生物=优历史=及格→语文=及格 物理=优历史=及格→语文=及格 从这样两条关联规则中可以看到,历史成绩与语文成绩存在较大的关联关系,如果想改善学生的语文成绩,就要同时考虑历史与语文之间的互动关系。 在文科成绩挖掘模型得到的结果里我们可以看到类似的情况: 语文=及格地理=及格一外语=及格 语文=及格外语=及格→地理=及格 这表明在语文成绩较差的前提下,地理和外语关系密切,改善这部分考生的学习成绩就要根据他们成绩体现出的特点有所侧重,不同老师之间可以加强合作与互动。因此,借助数据挖掘,本系统有助于全面的分析一个班级、学校、行政区域的学生的成绩状况,对中学教学质量的提升具有高度的实际意义,教学中可利用数据挖掘得出的结果针对学生的特点进行帮助和教育,以此取得理想的转化效果。

文档评论(0)

139****9425 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档