一种基于反区分矩阵的多维关联规则挖掘方法.pdfVIP

  • 12
  • 0
  • 约1.34万字
  • 约 4页
  • 2017-09-14 发布于湖北
  • 举报

一种基于反区分矩阵的多维关联规则挖掘方法.pdf

广西民族大学学报(自然科学版) 0FGUANGXIUNIVERsITYFORNATIoNALITIES VoI.19No.1 第19卷第1期 JOURNAL 2013年3月 (NaturalScienceEditi帅) Mar.2013 一种基于反区分矩阵的多维 关联规则挖掘方法。 唐 冰1,陆春芽2 (1.广西水利电力职业技术学院公共基础部,广西南宁530023; 2.广西大学电气工程学院,广西南宁 530004) 摘 要:针对多维数据集的关联规则挖掘,提出了一种基于反区分矩阵的方法。首先由数据集同步得出 区分矩阵和反区分矩阵,然后根据区分矩阵进行属性约简,再根据反区分矩阵找出约简后的频 繁项集,最后给出关联规则.通过区分矩阵和反区分矩阵将属性约简和关联规则挖掘联系起来, 减少了计算步骤,且算法只需扫描数据集一次,避免了繁琐的连接操作.应用实例表明该算法是 一种合理有效的关联规则挖掘方法. 关键词:粗糙集;反区分矩阵;多维数据;关联规则 中图分类号:TP392文献标识码:A 文章编号:1673—8462(2013)01—0062一04 0 引言 下,删除不相关或不重要的属性.主要的属性约筒算 关联规则是数据挖掘领域的一个重要研究内容, 法有:基于正区域的约简算法¨。,基于区分矩阵的约 它可以用于大型事务数据库的数据挖掘,从大量数据 简算法Ho,基于信息熵的约简算法u。. 中发掘项之间有趣的、隐藏的关联和相关联系.在对 目前,已有学者提出将属性约简应用于关联规则 数据库进行挖掘时,如果产生的规则为购买啤酒一购 挖掘中¨_70,其主要思想是先进行属性约简,删除掉 买尿布,这条规则只涉及用户购买的物品,是属于同 冗余属性,再按照传统方法对约简后的数据集进行关 一属性范围内的,称为单维关联规则;如果产生的规 联规则挖掘,属性约简和规则挖掘是单独进行的.笔 则为性别一“女”一职业一“秘书”,这条规则涉及两个 者提出了一种基于反区分矩阵的挖掘方法,通过区分 字段的信息,是两个维度上的一条关联规则,称为多 矩阵和反区分矩阵将属性约简和规则挖掘联系起来, 维关联规则: 减少了计算步骤,且避免了繁琐的连接操作,大大提 高了算法的效率. 粗糙集理论u。是1982年波兰数学家Pawlak提 出的.经过近20年的发展,粗糙集理论已被广泛应用 于人工智能、模式识别、机器学习、决策支持和数据挖 1相关的理论知识 掘等领域∽j.属性约简是粗糙集理论中一个重要的内 1.1粗糙集基本理论 容,它是在保持数据库的分类和决策能力不变的条件 定义1‘81形式上,四元组S一(U,A,V,,)是一 *收稿日期:2012—12—10. 基金项目:国家自然科学基金. 作者简介:唐冰(1964一),男,广西兴安人,广西水利电力职业技术学院讲师,研究方向:拓扑学及其应用;陆春芽(1987一), 女,广西百色入,广西大学硕士研究生,研究方向:粗糙集理论及应用,数据挖掘. 62 万方数据 2013年第1期 ●唐冰,陆春芽/一种基于反区分矩阵的多维关联规则挖掘方法 个知识表达系统,其中U为对象的非空有限集合,称 满足最小支持数,则称Xi为频繁项集. 为论域;A为属性的非空有限集;V—U亿,V。是属 定义9 规则Xi—yi的支持度定义为S(Xi—

文档评论(0)

1亿VIP精品文档

相关文档