医药信息分析与决策-关联规则.ppt

6.由频繁项集产生关联规 对于每一子集,可求出置信度如下: :confidence=2/4=50% :confidence=2/2=100% :confidence=2/2=100% :confidence=2/6=33% :confidence=2/7=29% :confidence=2/2=100% 由于最小置信度为70%,则只有上面第2、3和最后一个规则可以输出,因为只有这些产生强关联规则。 8.2.3 关联规则分类 1.基于规则中处理的变量的类别。 关联规则处理的变量可以分为布尔型和数值型。布尔型关联规则处理的值都是离散的、种类化的,它显示了这些变量之间的关系;而数值型关联规则可以和多维关联或多层关联规则结合起来,对数值型字段进行处理,将其进行动态的分割,或者直接对原始的数据进行处理,当然数值型关联规则中也可以包含种类变量。例如:性别=“女”=职业=“秘书” ,是布尔型关联规则;性别=“女”=avg(收入)=2300,涉及的收入是数值类型,所以是一个数值型关联规则。 8.2.3 关联规则分类 2.基于规则中数据的抽象层次。 基于规则中数据的抽象层次,可以分为单层关联规则和多层关联规则。在单层的关联规则中,所

文档评论(0)

1亿VIP精品文档

相关文档