基于Apriori算法在学生信息管理系统中应用与研究.docVIP

下载本文档

6
0
约2.7千字
约 6页
2018-06-23 发布于福建
举报
版权申诉

基于Apriori算法在学生信息管理系统中应用与研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Apriori算法在学生信息管理系统中应用与研究

基于Apriori算法在学生信息管理系统中应用与研究　　摘要：随着全球网络化，网络环境已被应用到各个领域，而学生信息的不断增加使得普通数据库已无法满足学生管理需求。为了促进学生信息管理工作更好的开展，利用数据挖掘技术从大量历史数据中挖掘其中隐含的信息就变得尤为重要，而挖掘的信息也可以作为指导学生信息管理工作开展的依据。本文以学生信息管理系统为研究对象，针对学生信息管理工作冗长复杂且管理困难等问题提出Apriori算法，Apriori算法在系统中的运用使得学生信息管理效率有了大幅度的提升。　　关键词：Apriori算法；信息管理；关联规则　　中图分类号：TP311.13 文献标识码：A 文章编号：1007-9599 （2012） 21-0000-02 　　学生信息管理工作作为学校管理工作的重要内容，目前学生信息管理工作内容包括学生资料、学生成绩、学生评估等多方面的内容，由于数据来源众多格式相对混乱，因而为信息管理工作带来了许多困难，无论是存储还是查阅都不方便。为了解决以上问题让管理员在存储、搜索和查阅学生信息的过程中更为简便高效，本文提出了一种基于Apriori算法的学生信息管理系统，该系统以学生成绩为例对关联规则在管理系统中的实际运用进行了研究和探索。引入关联规则算法中的Apriori算法对学生学年成绩进行分析，通过挖掘数据中潜在的信息来探索学生的发展规律，为提高教学水平提供一定的科学依据。　　1 数据挖掘技术　　1.1 数据挖掘理论。数据挖掘是一种透过数理模式对数据进行分析，并从大量数据中找出其潜在规律的一种挖掘技术，由于被挖掘的数据量庞大、模糊且不具备任何规律，所以数据挖掘数据是一项伟大的发现。数据挖掘又称知识发现，根据过程不同它大致可分为三个步骤，即数据准备、数据挖掘、结果表达和解释，由于数据挖掘可以挖掘出潜在的规律和信息，它可以帮助决策者调整市场策略以降低运营风险，做出正确的决策，所以它被广泛的应用于各个领域，对企业数据进行高度自动化的分析。　　1.2 关联规则简介。关联规则是指从数据库中找出高频数据项之间潜在的某种关系的规则，关联规则在实际领域中的运用使得资源得到了有效???利用，而个领域的服务质量有相对有所提升。Apriori算法是关联规则中常用的一种算法，也是数据挖掘技术中影响力较大的一种算法，其核心是基于两阶段频集思想的递推算法。首先应找出所有频集，然后由频集产生强关联规则，这些规则必须满足最小支持度和最小置信度，一旦规则生成那些小于用户预定最小置信度的规则则被排除，然后好再对剩下的频集进行搜索和扫描，在压缩收缩空间的同时提高频繁项集的置信度。　　2 关联算法在学生成绩管理系统的实现与具体应用　　2.1 关联规则在程序中的应用。在程序中实现关联规则首先应设计一个具有各种项集的类，还有一个可以判断PID对象是否为频繁项集的主要方法，然后根据事务表的存储方式对频繁集项进行SQL查询判断该频繁项集是否符合要求。先构造频繁项集k的非空真子集Lu，并进行连接步计算，若连接成功则生成候选项集k+1；计算出项集k+1的支持度，若支持度大于最小支持度，则标记为频繁项集；最后找出所有频繁项集的非空真子集Lu，并通过事务表计算出非空真子集的置信度，比较非空真子集的置信度与最小置信度的大小，若符合则该项集为一条关联规则，至此关联规则在程序中的应用就算实现了。　　2.2 数据挖掘的具体应用。由于学生推优需要得出一个公正全面的评价结果，所以评价过程需对学生各方面的信息和表现进行综合考虑，学科成绩和综合评测作为评价学生的重要依据，挖掘这两个数据库中的数据就成了推优工作的重要内容。本文将我院2009级机械工程专业毕业班的学生成绩作为数据挖掘的原始数据，并利用数据挖掘中的Apriori算法对这些原始数据进行分析，促进数据挖掘技术在高校信息管理系统中的运用。　　第一步：数据采集。如表1所示为2009级机械工程专业毕业班的学生成绩，将这些数据据聚集到一起并建立一个原始数据库，数据库中包含了48名学生以及22门课程，总共1056条记录。如表1所示为学生原始成绩数据：　　第二步：数据预处理。为了简化存储过程，我们可以去掉一些无关项目或是用一些简单的符号作为课程编号，通过这种数据转换方式对数据进行预处理。如表2所示用学号代替学生姓名、C1表示体育科目、C2代表大学语文、C3表示实习科目，用C4表示大学英语等。如表2所示为原始数据转换后的数据模式：　　第三步：数据转换：为了满足数据挖掘所需要求，在进行数据挖掘前我们应对数据的格式进行统一处理，在挖掘学生成绩的过程中引入关联分析，将预处理后的数据转换成逻辑型数据，而学生成绩数据表则用布尔型数据表表示，为了体现各学科之间的优劣关系，我们将90分以上的成绩用“