- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
贵州医科大学学生成绩数据挖掘和分析研究
贵州医科大学学生成绩数据挖掘和分析研究
摘要:为了解和探讨影响学生成绩的潜在因素,采用Microsoft SQL Service Analysis Services(SSAS)数据挖掘工具,对贵州医科大学教务信息管理系统中的学生基本信息及学生成绩进行数据挖掘分析,发现学生成绩与入学成绩、性别、生源、专业、教学单位均有相关关系,学生前期专业基础课、英语、体育、“马毛邓”等课程中,专业基础课程“优秀”则后期专业课也“优秀”的置信度最高。
关键词:数据挖掘;学生成绩;成绩分析;教学;贵州
中图分类号:G526 文献标识码:A 文章编号:1009-3044(2015)25-0001-03
1 引言
在我校教务信息管理系统中存储着学生个人基本信息以及各学期各门课程的考试成绩数据,这些数据具有实时性和历史性,并且数据量非常庞大。在本校,这些数据的主要用途是成绩查询和打印,对这些数据所隐藏价值没有挖掘利用,十分可惜。
传统的学生成绩分析通常只针对局部数据进行分析,采用的是统计分析法,该方法只是对事实的验证,描述已经发生的事实,取得均值、方差、区别显著性检验、信度等,难以发现数据中存在的关系和规律,也难以根据现有的数据预测未来的发展趋势,对于学生取得这些成绩的更多的相关因素无法了解,这样的成绩分析方法已不能完全满足需要。数据挖掘技术在金融、保险、电信、大型超市等积累有大量数据的行业有着广泛的应用,如信用分析、风险分析、欺诈检验、消费者习惯分析等。在教育领域应用相对较少,也有应用于高校学生成绩分析、试卷分析、课程相关分析的研究报告[1-6]。
本研究利用教务信息管理数据库中存放的学生基本属性信息和各学期各门课程的考试成绩数据,采用决策树、关联规则、分类技术等数据挖掘技术,对学生成绩数据进行挖掘研究,现将研究结果报告如下。
2 对象与方法
2.1 挖掘对象及目标
以我校2006级所有教务系统在册学生为研究对象,从学生的一些个人属性(如专业、性别、年龄、民族、省份、高考成绩)及各学年学期各门学科的考试成绩等大量信息中,分析揭示影响学生成绩的相关因素。
2.2 数据挖掘工具
采用Microsoft公司开发的Microsoft SQL Service Analysis Services(SSAS)数据挖掘工具,启用SQL Server数据库分析工具SQL Server Business Intelligence Development Studio,使用其中的决策树、关联分析、聚类算法分析工具。
2.3 数据准备
2.3.1 数据采集
从教务管理系统导出数据库文件123.dbf、2006级.dbf。
1)123.dbf数据库表属性包括:姓名、专业、班名、年级、性别、民族、KQ、BYZX、高考总分、XSLB、PYFS、入学日期、XZ、学校代码、层次。共12491条记录。
2)2006级.dbf数据库表属性包括:XH、XM、XSH、BM、XNXQ、KCH、KCM、XF、XS、KCSX、KSCJ、KCCJ、CXBKBZ、SFGD、JSH、BZ、KSSJ、KXH、QMCJ、LRSJ、CZR、PSCJ、SSNJ、SYCJ、QZCJ。共105309条记录。
2.3.2 数据净化
对数据库文件123.dbf、2006级.dbf表中数据去噪、去空、补遗。
1) 根据学生毕业学校填补学生省份,并将省份名统一,如将广西,广西省,广西壮族自治区统一为“广西”。
2) 将海南籍学生的高考成绩重新折算,公式为:高考成绩=(750×高考成绩)/900。
3) 增加高考等级字段,根据2006年贵州一本、二本及三本的高考录取分数线,将学生的高考成绩分为5个分数段:523(一本线)、464-523(二本线)、400-464、300-400、300。
4) 为未填写“高考总分”记录的高考等级字段填补为“未知”。
5) 清除KSCJ(考试成绩)为0的记录。
6) 增加KSDJ、QMDJ、PSDJ三个字段,将考试成绩、期末成绩、平时成绩划分为A、B、C、D四个等级,规则为:80-100 A(优秀),70-79 B(良好),60-69 C(及格), 60 D(不及格)。
2.3.3 数据集成
将123.dbf、2006级.dbf两张表以学号为关联字连接为2006.dbf,并为2006.dbf添加ID关键字段。得到2006.dbf共104617条记录。
2.3.4 生成挖掘数据库
将数据库2006.dbf导入SQL Server数据库,生成2006.mdf文件,为SSAS数据挖掘做好数据准备。
3 结果
3.1
您可能关注的文档
最近下载
- 车尔尼钢琴初步教程 作品599 教学与弹琴指导_12198815.pdf VIP
- 安全生产月竞赛题库(附参考答案).pptx VIP
- 2025年上海市绿化和市容管理局部分直属事业单位公开招聘笔试历年典型考题(历年真题考点)解题思路附带答案详解(5套).docx
- Unit 4 My friends Friends share第2课时冀教版(三起)(2024)英语三年级上册.pptx VIP
- 起风了sax五线谱.pdf VIP
- 影视话剧剧本_性情男女.docx
- 湘少版三年级上册英语全册教学课件.pptx
- 蚁群算法.ppt VIP
- 江苏开放大学《宏微观经济学》——计分作业2 .doc VIP
- 民族团结铸牢中华民族共同体意识PPT (3).pptx VIP
文档评论(0)