- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联规则Apriori算法学生成绩分析
基于关联规则Apriori算法学生成绩分析
摘要:关联规则挖掘是数据挖掘领域研究的热点问题,其中Apriori算法是经典的关联规则算法。将关联规则Apriori算法应用到学生成绩分析中,挖掘出课程与课程之间的相互关系,寻找各方面影响学生成绩的因素,发现隐藏在数据背后有价值的信息,从而为学生选课和教师教学以及教学管理工作等提供辅助性的建议与决策。
Abstract: Association rule mining is a hot topic in the field of data mining. Apriori algorithm is a classical association rule algorithm. This paper applies the association rule apriori algorithm to analyze student achievement data, digs out the relationship between the course and the curriculum, finds out the factors that affect the student achievement in all aspects, and finds the hidden information behind the data, so as to provide supplementary advice and decision-making for student course selection, teacher teaching and teaching management.
?P键词:学生成绩分析;数据挖掘;关联规则技术;Apriori算法
Key words: student achievement analysis;data mining;association rule technique;Apriori algorithm
中图分类号:TP311.1 文献标识码:A 文章编号:1006-4311(2018)05-0171-03
0 引言
近年来随着信息技术的飞速发展,数据资源变得越来越丰富,在高校的教学管理系统中存储了大量的学生成绩数据信息,但由于缺乏必要的技术手段,因此只能对这些数据信息进行简单的统计、备份和查询。隐藏在这些大量成绩数据背后的信息不能得到有效的利用,不利于人才的培养和教学质量的提高,因而迫切需要有更新的技术方法对这些数据进行处理分析。
关联规则挖掘[1-2]就是一门从历史数据集中发现隐含模式,从海量数据集中发现潜在的有价值信息的技术方法,它反映了一个事件与其他事件直接依赖或关联的知识,这几年已经成为数据挖掘技术研究领域的热门话题[3]。本文运用关联规则Apriori算法挖掘学生成绩数据,可以挖掘出课程与课程之间的相互关系、影响学生成绩的因素等一些有价值的信息,这些信息可为教学及管理工作提供支持性的建议,同时也为更加合理的制定人才培养方案和提高教育教学质量提供科学依据。
1 关联规则基本理论
2 关联规则挖掘算法
2.1 寻找频繁项目集
在对学生成绩数据进行关联规则分析时,这里采用了Apriori算法来寻找全部的频繁项目集。Apriori算法是一种重要的关联规则挖掘算法,它使用了一种被称为逐层搜索的迭代算法,k-项集用于搜索(k+1)-项集。首先需要扫描事物数据库,累积每个项的计数,然后收集满足最小支持度的项,从而找出频繁1-项目集的集合L1。L1用于寻找频繁2-项目集的集合L2,而L2用于寻找频繁3-项目集的集合L3,如此下去,直至不能找到频繁k-项目集Lk为止[4]。
运用频繁k-项集用于搜索(k+1)-项集是Apriori算法的核心,该步骤分为连接步和剪枝步:
①连接步骤:为了寻找Lk,在k(k1)次扫描数据库时,通过Lk-1与自身连接产生候选k-项集的集合Ck。
②剪枝步骤:由于Ck是Lk的超集,即Ck的成员可能是也可能不是频繁的。需要扫描全部的事务数据库,确定Ck中每个候选的计数,判断是否大于或者等于最小支持度计数,如果是,那么便认为该候选是频繁的。为了压缩Ck,可以运用Apriori性质:任何一个频繁项集的全部非空子集也一定是频繁的,若某个候选的非空子集不是频繁的,那么该候选项集肯定也不是频繁的,从而可以将其从Ck中删去。
Apriori算法描述如下[5-6]:
输入:数据库D;最小支持度min_Support
输出:D中的频繁项目集L
方法:
L1=find_frequent_1-itemsets(D);;
您可能关注的文档
- 基于公共娱乐场所消防防火研究.doc
- 基于公共成本考虑农民工市民化成本分摊机制及对策研究.doc
- 基于公共政策价值目标网络反腐审视.doc
- 基于公共政策学视角下市县政府依法行政分析.doc
- 基于公共文化图书馆延伸服务探索.doc
- 基于公共文化服务体系公共图书馆儿童阅读推广研究.doc
- 基于公共政策医患冲突分析.doc
- 基于公共文化服务体系建设公共档案馆发展探析.doc
- 基于公共文化服务体系建设图书馆创新发展策略研究.doc
- 基于公共文化服务图书馆联盟建设实践研究.doc
- 2025至2030全球及中国订单管理软件行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030国内液晶显示屏行业市场发展分析及竞争策略与投资发展报告.docx
- 2025至2030港口设备市场前景分析及细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030量子加密通信行业发展现状及投资前景战略报告.docx
- 2025至2030中国音乐合成器行业运营态势与投资前景调查研究报告.docx
- 2025至2030中国液压行业市场发展现状及竞争格局与投资机会报告.docx
- 2025至2030中国异戊橡胶行业运营态势与投资前景调查研究报告.docx
- 2025至2030帕西肽行业市场占有率及有效策略与实施路径评估报告.docx
- 2025至2030全球及中国超收敛集成系统行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030尖齿铣刀行业市场占有率及有效策略与实施路径评估报告.docx
最近下载
- JJF(鲁) 194-2024 专用砝码地方校准规范.docx VIP
- 上海市虹口区2024-2025学年六年级数学第一学期期末联考试题含解析.doc VIP
- sop知识讲解 _原创精品文档.pdf VIP
- 《老年人能力评估》精品课件——项目六 老年人感知觉与社会参与能力评估.pdf VIP
- JJF(京) 3020-2022 溴甲烷气体检测仪校准规范.docx VIP
- 信息隐藏技术课件 第三章 图像信息隐藏与水印.pptx VIP
- KorgKorg wavestate合成器入门指南.pdf
- Devereux幼儿评估量表第二版DECA-P2.docx VIP
- 2025年度最后一次行政班子会议,校长讲话:大局观,效率观,质量关.docx VIP
- JJF(吉) 72-2014 油气回收检测仪校准规范.docx VIP
原创力文档


文档评论(0)