基于粗糙集的关联规则挖掘在教师成长中的应用..docVIP

基于粗糙集的关联规则挖掘在教师成长中的应用..doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于粗糙集的关联规则挖掘在教师成长中的应用..doc

关于进一步完善居民医疗救助制度的实施 意见 各镇人民政府,各街挖掘是数据挖掘中的一个重要问题, 在最近几年被广泛研究。本文将粗糙集理论及方法引入高校 教师成长信息,通过属性约简降低属性纬数,然后基于粗糙 集理论进行关联规则挖掘,得出了一些有益的结论,为拓展 粗糙集的应用领域做出了有益的探索。关键词粗糙集;关 联规则;教师成长;区分矩阵;属性约筒粗糙集理论是由 波兰数学家在80年代初提出的一种处理模糊和不精确性问 题的新型数学工具。利用粗糙集理论进行数据挖掘,重要的 一点就是基于粗糙集理论的属性约简。通过约简操作降低属 性的纬数,总结出适用于决策支持的知识规则,是粗糙集理 论最重要的应用之一。关联规则挖掘是数据挖掘中的一个重 要问题,随着全球范围内数据库中存储的数据量迅速增大, 数据间的关联规则往往过于庞大而难以分析,如何有效的得 到有意义的关联规则成为研究热点。本文以高校信息化为应 用背景,将基于粗糙集理论的数据挖掘技术应用于高校教师 成长过程,得到实际可用的关联规则,为管理者提供决策支 持。粗糙集理论的基本概念粗糙集理论将分类与知识联系 在一起,认为知识源于有认知能力的主体的分类能力,并用 等价关系形式化表示分类。定义1:粗糙集理论中定义信息 系统为一个如下四元组:3=(1^,¥^),其中U=(xl,x2,…,xn) 是对象集,即论域;A是属性集合,A=C UD,且CnD=O, 其中C为条件属性,D为决策属性;V为属性A的值域;F是 UXA-V的映射,它为U中各对象的属性指定唯一值。S又被 称为决策表。定义2:在信息系统S中,对于一属性集I eA, 可构造对应的二元等价关系。IN D(I) {EUXU| v aei,有 a(x)=a(y)},称IND(I)为由I构造的不可分辨关系。不可分 辨关系实际上就是I上的等价关系。因此,针对属性集I上 的不可分辨关系,U可划分为几个等价类,用U/IND(I)表示。 定义3:约简定义为不含多余属性并保证分类正确的最小条 件属性集。假设条件属性集C的简约是C的一个非空子集C, C和C必须满足以下两个性质:ind(C,D)=ind(C,D),不 存在C C有ind(C,D)=ind(C,D)。一个决策表可能同 时存在几个约简,C的约简的集合记作Red(C)。这些约筒的 交集定义为决策表的核(Core),Core (C) = ARe d(C)核中的属 性是影响分类的重要属性。定义4:信息系统S中关于属性 集C的区分矩阵M= (mi j)nXn定义为: M(C) = (mi j)nXn是代表了区分xi, xj的完整信息。关 联规则关联规则是在交易数据、关系数据或其他信息载体中, 查找存在于项目集合或对象集合之间的频繁模式、关联、相 关性、或因果结构,通过分析数据或记录间的关系,决定哪 些事情将一起发生。定义6:设I={il,i2,…,in}是项的集 合。包含K个项的项集称作K项集。设D是数据库记录的集 合,其中每个事务T是项的集合,且TI。设X是一个项集, 事务T包含X当且仅当XT。关联规则是形如XY的蕴涵式, 这里XI,YI,且XnY=O。X称为规则的左部或规则的前提, Y称为规则的右部或结论。度量规则的参数是支持度与置信 度(Confi dence)。支持度是指数据集中的实例同时包含条件 属性与决策属性的共同概率,支持度揭示了规则的重要性。 置信度表示实例在包含条件属性的前提下,也包含决策属性 的条件概率,它揭示了规则的可信度。在粗糙集理论中支持 度与置信度可以表示为: 其中P⑴表示是指X在数据D中出现的概率,其余雷同。 Su pport (XY)指X、Y在D中同时出现的概率;Confidence (X Y)表示在X出现的前提下Y出现的条件概率。如果得到的规 则同时满足支持度不小于支持度阈值和置信度不小于置信 度阈值,则该规则有意义。本文应用基于粗糙集的关联规则 的挖掘过程分为三步:数据预处理,属性约简与关联规则的 挖掘,见图1。数据预处理:通过对高校人事数据的初始信 息进行数据清洗,缺失值处理,转换及数据选择,获取初始 信息表,且初始表转换为粗糙集形式,并明确条件属性集和 决策属性;属性约简:对条件属性进行约简,删除多余属性, 用区分矩阵来完成约简和求核,在此基础上生成约筒属性集 关联规则挖掘:输入支持度阈值和置信度阈值,根据数据约 简结果,利用粗糙集理论文献[6]中的算法,进行关联规则 的挖掘。 1基于粗糙集的关联规则模型随着信息化在社会各方 面的迅速普及,高校在近几年来已经掌握了大量的教师信息 数据,并形成了相应的教师信息数据库。然而,面对如此海 量的信息,高校管理者如何利用,如何从中发现对高校教师 队伍建设有实际指导意义的规律,特别是如何才能将人才的 引进及培养与社会的需求正确结合?

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档