基于关联规则Apriori算法学生成绩分析.docVIP

下载本文档

176
0
约4.45千字
约 9页
2018-08-29 发布于福建
举报
版权申诉

基于关联规则Apriori算法学生成绩分析.doc

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于关联规则Apriori算法学生成绩分析

基于关联规则Apriori算法学生成绩分析　　摘要：关联规则挖掘是数据挖掘领域研究的热点问题，其中Apriori算法是经典的关联规则算法。将关联规则Apriori算法应用到学生成绩分析中，挖掘出课程与课程之间的相互关系，寻找各方面影响学生成绩的因素，发现隐藏在数据背后有价值的信息，从而为学生选课和教师教学以及教学管理工作等提供辅助性的建议与决策。　　Abstract： Association rule mining is a hot topic in the field of data mining. Apriori algorithm is a classical association rule algorithm. This paper applies the association rule apriori algorithm to analyze student achievement data， digs out the relationship between the course and the curriculum， finds out the factors that affect the student achievement in all aspects， and finds the hidden information behind the data， so as to provide supplementary advice and decision-making for student course selection， teacher teaching and teaching management. 　　?P键词：学生成绩分析；数据挖掘；关联规则技术；Apriori算法　　Key words： student achievement analysis；data mining；association rule technique；Apriori algorithm 　　中图分类号：TP311.1 文献标识码：A 文章编号：1006-4311（2018）05-0171-03 　　0 引言　　近年来随着信息技术的飞速发展，数据资源变得越来越丰富，在高校的教学管理系统中存储了大量的学生成绩数据信息，但由于缺乏必要的技术手段，因此只能对这些数据信息进行简单的统计、备份和查询。隐藏在这些大量成绩数据背后的信息不能得到有效的利用，不利于人才的培养和教学质量的提高，因而迫切需要有更新的技术方法对这些数据进行处理分析。　　关联规则挖掘[1-2]就是一门从历史数据集中发现隐含模式，从海量数据集中发现潜在的有价值信息的技术方法，它反映了一个事件与其他事件直接依赖或关联的知识，这几年已经成为数据挖掘技术研究领域的热门话题[3]。本文运用关联规则Apriori算法挖掘学生成绩数据，可以挖掘出课程与课程之间的相互关系、影响学生成绩的因素等一些有价值的信息，这些信息可为教学及管理工作提供支持性的建议，同时也为更加合理的制定人才培养方案和提高教育教学质量提供科学依据。　　1 关联规则基本理论　　2 关联规则挖掘算法　　2.1 寻找频繁项目集　　在对学生成绩数据进行关联规则分析时，这里采用了Apriori算法来寻找全部的频繁项目集。Apriori算法是一种重要的关联规则挖掘算法，它使用了一种被称为逐层搜索的迭代算法，k-项集用于搜索（k+1）-项集。首先需要扫描事物数据库，累积每个项的计数，然后收集满足最小支持度的项，从而找出频繁1-项目集的集合L1。L1用于寻找频繁2-项目集的集合L2，而L2用于寻找频繁3-项目集的集合L3，如此下去，直至不能找到频繁k-项目集Lk为止[4]。　　运用频繁k-项集用于搜索（k+1）-项集是Apriori算法的核心，该步骤分为连接步和剪枝步：　　①连接步骤：为了寻找Lk，在k（k1）次扫描数据库时，通过Lk-1与自身连接产生候选k-项集的集合Ck。　　②剪枝步骤：由于Ck是Lk的超集，即Ck的成员可能是也可能不是频繁的。需要扫描全部的事务数据库，确定Ck中每个候选的计数，判断是否大于或者等于最小支持度计数，如果是，那么便认为该候选是频繁的。为了压缩Ck，可以运用Apriori性质：任何一个频繁项集的全部非空子集也一定是频繁的，若某个候选的非空子集不是频繁的，那么该候选项集肯定也不是频繁的，从而可以将其从Ck中删去。　　Apriori算法描述如下[5-6]：　　输入：数据库D；最小支持度min_Support 　　输出：D中的频繁项目集L 　　方法：　　L1=find_frequent_1-itemsets（D）；；