基于改进Apriori算法的Java课程成绩关联分析与教学策.docxVIP

基于改进Apriori算法的Java课程成绩关联分析与教学策.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于改进Apriori算法的Java课程成绩关联分析与教学策略优化研究

2024年《中共中央国务院关于弘扬教育家精神加强新时代高素质专业化教师队伍建设的意见》中强调,实施数字化赋能教师发展行动,推动教师积极应对新技术变革,并着眼于未来培养人才,目标是到2035年,实现数字化赋能教师发展成为常态1。成绩数据是一项重要的信息资源,通过运用先进的数据挖掘技术对其进行分析,寻找课程之间、课程知识点之间的关联性,有助于发现课程之间的相互影响,为优化课程设置和教学内容提供数据支持,构建数字化背景下的新型教学模式,促进教学更好地适应知识创新和素养发展等新要求。

在国外,许多研究者利用Apriori算法等数据挖掘技术,对学生成绩、学习行为等教育数据进行分析,以提高教育质量和学生学习效果[2]。近年来,国内学者围绕Apriori算法在教育数据挖掘领域的改进与应用展开广泛研究,袁路妍等通过压缩事务数据库提升计算效率[3],王桌芳等引入兴趣度度量函数优化规则筛选[4],张梁等进一步结合提升度指标增强规则的有效性5]。在应用层面,该算法被用于学生成绩预警]、课程关联分析及知识点规则挖掘[8]。同时,多技术融合趋势显著,如李秋香通过K-means聚类与关联规则联动分析学生层次[9,范圣法等结合FP-growth算法实现课程评价自动化[10]。

1.改进的Apriori算法介绍

传统关联规则算法,如经典的Apriori算法,是一种用于从大规模数据集中挖掘频繁项集和关联规则的方法。对于一个项集:I={ii,i2,…,im},事务集D={t1,t2,…,tn}中的每个事务都是I的真子集,由k个项组成的集合为k项集,而频繁项集就是高于设定支持度和置信度阈值的项集。在事务集D中挖掘得到的关联规则可以表示为X?Y;:X、Y分别是关联规则的因和果,通常称X为该条关联规则的前项、Y为该条关联规则的后项。其中:

支持度是衡量项集在数据集中出现的频率,假设X,Y∈I为项集,前项X对后项Y的支持度,为X、Y的联合概率:

置信度衡量在X发生的情况下,Y

也发生的概率。对于规则X?Y,其置信度为X、Y的条件概率,具体公式为:

改进的Apriori算法在此基础上引入提升度和兴趣度两个度量阈值,提升度通过量化X对Y的影响程度(相较于Y的独立发生概率),确保筛选出的规则具有实际业务价值,计算公式如下:

其中,Lift表明X与Y呈正相关,I表明X与Y呈负相关,1表明X与Y不相关。

兴趣度(Interest)通过计算置信度与支持度的差值与它们之间最大值的比例,评估关联规则的正负相关程度,帮助筛选出更有意义的规则,避免生成大量无用或冗余的规则,从而提高规则的质量和实用性。

Interest的程度衡量X和Y之间正相关度,反之Interest的程度反映说明X和Y之间的负相关度。如果Interest,说明X和Y之间没有显著的相关性。

G-知音-Java课程教学策略优化研究

2.基于改进的Apriori算法的Java成绩关联分析

2.1数据准备及预处理本研究使用了作者所在学校大数据管理与应用专业2022~2023级共377位同学部分科目成绩。这些科目包括:大数据管理与应用导论、计算机应用基础、微积分1、管理经济学、微积分2、Java、数据结构、数据库原理及应用、Python程序设计和概率论。

表1布尔数据框

表2部分强关联规则

表3教学实践效果

对于每门课程,以70%分位数进行分界,创建一个新的列,将学生的成绩转换为二值化数据:如果学生的成绩大于等于70%分位数成绩,则标记为1(达标)。如果学生的成绩小于70%分位数成绩,则标记为0(未达标)。这一步将原始的数值型成绩数据转换为二值化的布尔矩阵,便于后续的关联规则挖掘。转码后的部分布尔数据框如表1所示。

2.2关联规则分析

在Python3.10环境下使用改进的Apriori算法对处理后的数据进行挖掘,设置最小支持度0.3,最小置信度0.7,最小提升度1.01。经过计算,满足最小支持度、置信度、提升度的强关联规则有85条,部分强关联规则见表2。以规则5为例,支持度为43.22%,置信度为77.63%,意味着学好大数据管理与应用导论,有77.63%的可能性会学好JAVA课程,并且提升度大于1、兴趣度大于0,表明关联规则有意义。

经过对最终结果的分析,可以得出以下结论。

(1)核心课程之间的关联度:“数据库原理及应用”与“数据结构”共同作为前项时,对“Java”课程的置信度达到88.35%(提升度1.3475),表明这两门课程的知识体系对Java学习具有显著支撑作

文档评论(0)

std365 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档