关联规则挖掘r.docVIP

  • 8
  • 0
  • 约3.3千字
  • 约 10页
  • 2016-12-04 发布于重庆
  • 举报
关联规则挖掘r

R语言关联规则可视化:扩展包arulesViz的介绍 关联规则挖掘是一种流行的数据挖掘方法,在R语言中为扩展包arules。然而,挖掘关联规则往往导致非常多的规则,使分析师需要通过查询所有的规则才能发现有趣的规则。通过手动筛选大量的规则集是费时费力。在本文中,我们基于探索关联规则的R扩展包arulesViz,提出几个已知的和新颖的可视化技术。 1、简介 算法步骤这里不做详细介绍,下面是几个重要的变量的定义: Supp(X=Y) = P(X) 支持度 Conf(X=Y) = P(Y|X) 置信度 Lift(X=Y) = CONF(X=Y)/SUPP(Y) = P(X and Y)/(P(X)P(Y)) 提升度 (Lift)是避免了一些不平衡数据标签的偏差性,?Lift越大,则数据质量较好;Lift越小,则数据越不平衡。 2、数据准备和arulesViz的统一接口 使用扩展包arulesViz之前,我们首先需要加载它。这个包会自动加载其他所需要的数据包,如arules。如下面的数据集Groceries包含在arules包里面。 library(arulesViz) data(Groceries) summary(Groceries) 设置支持度为0.001,置信度为0.5,R语句入下: ?rules - apriori(Groceries, parameter

文档评论(0)

1亿VIP精品文档

相关文档