毕业设计(v1.0)——柳汝滕.pptVIP

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
毕业设计(v1.0)——柳汝滕

结果分析 关联规则分析 支持度0.08,置信度0.8,置信度区间0,0.8 对比i2smap.txt,可以发现104:软件开发生产实习 [2]:优秀:4与较多的课程有着密切的关联,且多数课程为基础性课程较好,如5:大学物理[2]:优秀,70:软件工程课程设计[4]:优秀,122:工科数学分析(2)[6]:优秀等,可以看出“软件开发生产实习”的成绩的优秀是与前面基础课程的优秀与否是息息相关的,基础课程较好的同学,在“软件开发生产实习”课程的成绩一般也会较好。 信息量公式生成的关联规则 关联规则的后项最多的就是43:软件工程环境与工具实验 [1]:中等:6,通过查看信息熵数据,发现“软件工程环境与工具实验 [1]:6”的信息熵也较小,从而再次印证了,通过信息熵删除部分冗余课程的可信度。 此外,如:[106] [15] -0.4133086 0106:大学语文 [2]:及格:1与15:思想道德修养与法律基础 [2]:良好:2,更是不存在明显的关联关系,说明这两门课程的安排可以不存在先后顺序,不会产生相互之间的影响。 对正关联规则,选择部分规则进行分析: a)[196] [169] 00.089655176: 196:程序设计基础 [3]:不及格:1,169:程序设计实验 [1]:及格:1,该规则的信息量数值较高,支持度也满足最小要求。该规则说明如果程序设计基础学习不好,程序设计实验也不容易得到较高的分数。 b) [125] [70] 00125:软件工程 [3]:优秀:4,70:软件工程课程设计 [1]:优秀:4,该规则的信息量数值同样较高,支持度也较高。该规则也比较符合我们对课程安排的要求,说明软件工程学科学习比较优秀的同学,他的软件工程课程设计的成绩优秀的可能性也比较大。 05 PART FIVE 总结 总结 1)关联规则挖掘在频繁集的生成速度方面,依然有着改进空间,如分布式计算、并行运算等; 2)关联规则生成方面,传统的按照置信度的方式找出关联规则并不能很好的适用于所有的系统,本课题通过信息量与信息熵理论提出了改进公式是一个比较好的尝试,但也需要大量的实验进行验证。今后有必要在关联规则生成公式方面做大量研究; 3)数据预处理对关联规则挖掘有着较大的影响,如何更好的对数据进行处理,是决定规则挖掘的好坏的重要影响因素。 模板来自于 * 基于关联规则的 成绩分析系统设计与实现 答辩人:柳汝滕 学号:201101051718 指导教师:倪维健 Contents 目录 01 02 03 04 课题背景与目的 关联规则 Apriori算法与改进 系统实现 05 总结 01 PART ONE 课题背景与目的 数据挖掘 数据挖掘(DM, Data Mining)是指的是从大量、模糊、离散的数据捕捉有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。 课题目的与意义 A同学的a课程得分属于优秀,同时该学生的b课程得分也属于优秀,是否可以推断a课程优秀的同学b课程相应的也多数为优秀。 根据学生课程成绩信息,找到成绩与课程之间可能蕴含的关联信息。如:找到不同的课程之间可能存在着开课顺序对成绩的影响,为学生课程安排提供建议。某一门课程学习较差的同学,可能会影响另外一门课程的成绩,方便老师有针对性的辅导。 02 PART TWO 关联规则 关联规则(Association Rules)分析是数据挖掘方向的重要组成部分。能够通过对大量的数据集的研究,发现其中隐含的让人感兴趣的联系,并将所发现的联系采用频繁集和关联规则的形式展示出来。 关联规则 关联规则包含如下几个概念: 1.事务(t) 2.项与项集(i) 3.支持度(minSup) 4.置信度(minConf) 5.频繁集 6.关联规则(X-Y) 每一个交易D中,事务同时包含X,Y的百分比,则称之为XY的支持度,即其概率。如{牛奶,鸡蛋},2/5 置信度是已知D中的事务包含了X的情况下,包含Y的百分比,即条件概率。如{面包|牛奶},1/3 如果一个项集(如:{牛奶,面包})的支持度大于给定的最小支持度阀值,则就可以称其为频繁项集 关联规则用X-Y表示,其中X与Y没有交集,即X∩Y=φ。X称为前件,Y称为后件。如果X-Y的置信度大于最小置信度,则成为强关联规则。 关联规则挖掘步骤 03 PART THREE Apriori算法与改进 Apriori算法 Apriori算法是关联规则挖掘中最经典的算法 Apriori算法性质:任何频繁项集的所有非空子集也必然是频繁的。 反证:如果P(I)minSup,则P(A∩I)=P(I)

文档评论(0)

celkhn5460 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档