- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机基础教育运用关联规则
计算机基础教育运用关联规则
一、引言
职校学生都要参加江苏省计算机办公自动化等级考试,为了保证学生考试通过率我们引进了在线考核系统。该系统通过网络服务器的设置,学生所用的计算机作为客户端来登录服务器随机抽取试题,答题完毕后网上提交试卷,系统会对学生的答卷进行分类、整理,并指出错误原因。近几年来,随着该系统的深入应用,暴露出许多错误率较高的题目,虽然教师能够获得学生错误的具体数据,但长久以来都只是被动的纠正问题,却不能发现错题之间潜在的联系。数据挖掘中关联规则就是从大量的数据中挖掘出有价值、有意义的内在联系。本文通过在线考核系统利用关联规则对错题数据进行挖掘,从中发现错题之间潜在的联系,找到学生学习的难点,进而指导教师主动的预防错误发生,提高教学质量。
二、关联规则理论
1.关联规则的作用
关联规则挖掘是数据挖掘中是一个重要的课题,它是一个自学习的过程。反映一个事物与其他事物之间的相互依存性和关联性,揭示数据间未知的依赖关系。假如两个或者多个事物之间存在一定的关联关系,那么其中一个事物就能够通过其它事物猜测到。关联规则侧重于确定数据中不同域之间的联系,通过支持度和可信度定量地描述这种关联的程度,以此可以发现人们不知道的、或者是出乎人们预料的规则。
2.关联规则的基本概念
设I={i1,i2,...,im}是数据项的集合。D是所有事务的集合(即数据库),每个事务T是一些项目的集合,T包含在I中,每个事务可以用唯一的标识符TID来标识。关联规则是形如AB的蕴涵式,其中AI,BI,且Acap;B=,A称为前提,B称为结果。含义是如果A出现在一条记录中,则在这条记录中B同时出现的可能性比较高。支持度:项集A在事务集D中的支持度是D中包含A的事务数,记作Support(A)。规则AB的支持度定义为P(Acup;B),表示A、B同时出现的可能性,即支持度(AB)等于包含A和B的元组数除以元组总数。记作:Support(AB)=P(Acup;B)。支持度描述了项集A和B在所有事务中同时出现的概率。例如一个文具店某天共有100笔业务,其中有10笔业务同时买了铅笔和橡皮,则关联规则“铅笔=gt;橡皮”的支持度为10%。置信度:规则AB的置信度定义为D中包含A的事务的同时也包含B的可能性,也就是在A出现的条件下B也出现的概率,即可信度(AB)等于包含A和B的元组数除以包含A的元组数。
记作:Confidence(AB)=P(B|A)=P(Acup;B)/P(A)。支持度是对关联规则的重要性的衡量,而置信度是对关联规则的准确度的衡量。支持度说明了这条规则在所有事务中有多大的代表性,显然支持度越大,关联规则越重要。有些关联规则置信度虽然很高,但支持度却很低,说明该关联规则实用的机会很小,也不重要。只有符合最小支持度和最小可信度的规则才可称为强规则。当给定一个事务集D时,关联规则挖掘就是要产生强规则。
3.关联规则挖掘求解问题的步骤
(1)预处理与采掘任务有关的数据,根据具体问题的要求对数据库进行相应的操作,从而构成规格化的数据库D。(2)针对D求出所有满足最小支持度的项集,即频繁项集。(3)生成满足最小置信度的规则,形成规则集R,解释并输出R。4.关联规则挖掘的经典算法mdash;mdash;Apriori算法Apriori算法是一个很有影响的关联规则挖掘算法,它的核心是基于频集理论的递归方法,是挖掘单维布尔关联规则的一种重要方法,但具有一定的局限性。Apriori算法就是根据有关频繁项集特性的先验知识(priorknowledge)而命名的。该算法利用了一个层次顺序搜索的循环方法来完成频繁项集的挖掘工作;这一循环方法就是利用k项集来产生(k+1)项集。Apriori算法的基本思想是将关联规则挖掘算法的设计分解为两步:(1)找到所有支持度大于最小支持度的项集,即频繁项集;
(2)使用第一步找到的频繁项集产生所期望的规则。Apriori算法表示如下:输入:事务数据库D;Min_sup;Min_con。输出:事物数据库D中所有的频繁项集L。方法:L1={large-itemsets};for=(k=2;Lk-1;k++)dobeginCk=apriori-gen(Lk-1);foralltransactiontisin;DdobeginCt=subset(Ck,t);forallcandidatecisin;Ctdoc.support++;endLk{cisin;Ct|c.supportgt;=min_sup}endL=UkLk;
三、关联规则在等级考试模拟系统中的应用
学生通过在线考核系统进行测试,完成测试后答案自动上报到系统。教师利用该系统对学生的答案进行评判,系统会将学生做错的内容和学生
您可能关注的文档
最近下载
- 云南镇沅金矿石浮选试验报告.doc VIP
- 大型载重车辆“油改气”项目方案介绍.pdf VIP
- 四上语文1-8单元高频考点通关检测(8页).pdf VIP
- 水泥化学分析习题及答案.doc VIP
- 2022年南京信息职业技术学院高职单招语文/数学/英语考试题库含答案解析.docx VIP
- 广东省广州市南沙区2023-2024学年八年级上学期期末考试英语试题(含答案).docx VIP
- 平面的基本性质及推论多媒体教学课件.ppt VIP
- 【复旦大学-高级病理生理学学习】_模式识别受体_20200425234131.pdf VIP
- 高中数学《函数的奇偶性》说课稿新人教A版必修1 .pdf VIP
- 膈肌膨升症麻醉病例讨论.ppt VIP
原创力文档


文档评论(0)