- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
目 录
1 绪论 2
1.1课题研究背景及选题意义 2
1.2 数据挖掘的产生背景及研究现状 2
1.3数据挖掘技术在国内教育领域的研究现状 2
1.4 论文研究的内容及结构安排 3
2 数据挖掘的基本知识 3
2.1 数据挖掘的概念 3
2.2 数据挖掘的过程 4
2.2.1 数据预处理 4
2.2.2 数据挖掘 4
2.2.3结果的解释和评估 4
2.3 数据挖掘的功能 4
2.3.1 概念/类描述:特征化和区分 4
2.3.2 挖掘频繁模式、关联和相关 5
2.3.3 分类和预测 5
2.3.4 聚类分析 5
2.3.5 离群点分析 5
2.3.6 演变分析 5
2.4 数据挖掘的方法 6
2.4.1 关联规则 6
2.4.2 决策树方法 6
2.4.3 神经网络方法 6
2.4.4 遗传算法 6
2.4.5 聚类分析 7
2.4.6 粗糙集 7
3关联规则算法 7
3.1 关联规则概述 7
3.2关联规则算法(Apriori算法) 8
3.2.1 使用候选项集找频繁项集 8
3.2.2 由频繁项集产生关联规则 9
4 学生成绩数据挖掘系统的设计与实现 9
4.1 关联规则算法参数说明 9
4.2 分析目标 9
4.3 数据准备 9
4.4 数据的预处理 10
4.5 创建挖掘模型视图 11
4.6 学生成绩挖掘系统的实现 11
4.6.1 设置参数 11
4.6.2 生成频繁1-项集L1 11
4.7 结果的分析 15
5 总结与展望 16
5.1 总结 16
5.2 展望 16
数据挖掘在学生成绩分析中的应用
摘 要:随着社会教育事业的发展,努力提高高校学生的教学质量是每所高校的目标,学生成绩是评估高校教学质量的重要依据。当今高校规模不断扩大,学生数量不断增多,随着社会的发展,学生成绩受越来越多的因素影响,学生成绩分析更加重要。从大量数据中发现其潜在规律来研究学生成绩,预测成绩的发展趋势,从而给教师的教学环节提出有针对性的建议,对学生的管理教学工作有的放矢,提高授课和学习效果显得非常重要。因此,本文引进了近年来兴起的数据挖掘技术用于高校学生成绩中分析,找出影响学生成绩的根本原因及教学方面的相关问题,从而给学校提出宝贵的意见,提高教学质量。
本文所做的工作如下:首先,介绍了数据挖掘基本理论和数据挖掘在高校教育领域的应用现状;其次,建立了本院校计算机系08级学生成绩数据库,并使用关联规则中的Apriori算法对学生成绩数据进行挖掘,得出学生各门学科成绩之间的关系;最后,对关联规则的出的结果进行分析,得到影响学生成绩的主要因素,并提出可行的方案等。这些分析结果将对高校今后改进教学工作和对学生的教学管理有着重要的参考价值。
关键词:学生成绩;数据挖掘;关联规则;Apriori算法
1 绪论
1.1课题研究背景及选题意义
数据挖掘 (DataMining),又称为数据库中的知识发现(众 owledgeDiseove汀inDatabases,简称KDD),能够从数据库中抽取有效的、隐含的、潜在有用的知识。数据挖掘是信息技术研究的热点问题之一。由于在数据分析方面的优越性,数据挖掘技术已成功地应用到大型商业、金融业、保险业等许多领域,但在教育教学层面的应用还比较少,处于发展的初级阶段。
随着教育的发展,学生的学生成绩在高校学习生活中占据越来越重要的地位。学习成绩不仅是学校评估教学质量的重要依据,也是学生在大学学习中对所学知识的掌握程度的一个重要标志。由于影响学生成绩的因素很多,那么如何能从大量的学生成绩分数中得到该学生的学习成绩至关重要。对学生成绩的分析,从大量数据中存在的关系,规则中对学生成绩进行研究,预测其发展趋势,从而对教师的教学提出宝贵的意见,对学生的教学是十分有利的。
传统的评价一个学生的学习成绩是根据该学生的平均值、方差、信度等数学方法来评价的,这些方法都行,但不够全面,有一定的局限性。在如今信息时代,传统的方法对数据内在价值的分析要求已无法满足,所以本课题将采用数据挖掘技术分析学生成绩。对学校现有的学生数据库进行有效的数据挖掘,利用其中的关系和规则做出相应的决策,给学校及教师一个满意的结果,从而对学校更好的教育管理学生提供了可高的支撑。
因此数据挖掘在学生成绩中的分析应用具有现实的意义
1.2 数据挖掘的产生背景及研究现状
随着数据库技术和网络技术的快速发展,办公信息化逐步增强。随之而来的信息量也呈爆炸式增长,人们生活与工作中生成的数据越来越多,这些海量的数据给人们带来了便利,同时也给人们对数据的利用带来了许多新问题。主要有如下四点问题:第一是信息爆炸式增长,难以消化;第二是信息真假难以辨识;第三是信息安全难以保证;第四是信息形式不一致难以统一处理。数据库系统在数据存储和数据管理方面得到很大的改善,能够高效地实
您可能关注的文档
- 设计构建中小型企业网络(包括总部).doc
- 设计批评的标准类型研究.doc
- 设计用于皮带运输机的单级斜齿圆柱齿轮减速器.doc
- 社会监理的工作内容、程序和方法.doc
- 社会调查——关于中国快递业行业发展趋势.doc
- 社会主义新农村建设及基础教育的现状分析和对策措施.doc
- 摄影带给我们什么.doc
- 伸缩式自行车车库.docx
- 身体力行,勇于实践——我的职业生涯设计.doc
- 深基坑大底板浇筑施工方案1.0版.doc
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
文档评论(0)