第十二部分卫生信息分析课程.pptVIP

  • 1
  • 0
  • 约4.04千字
  • 约 34页
  • 2016-12-05 发布于江苏
  • 举报
(三)关联规则挖掘的Apriori 算法 候选1-项集 面包 4 牛奶 4 尿布 4 啤酒 3 鸡蛋1 可乐 1 频繁1-项集 面包 4 牛奶 4 尿布 4 啤酒 3 候选2-项集 面包 牛奶3 面包 尿布3 面包 啤酒2 牛奶 尿布3 牛奶 啤酒2 尿布 啤酒3 候选1-项集 面包 尿布 牛奶2 面包 尿布 啤酒 2 牛奶 尿布 啤酒 2 频繁2-项集 面包 牛奶3 面包 尿布3 牛奶 尿布3 尿布 啤酒3 Apriori 算法的基本操作步骤举例 (四)关联规则的生成 同时满足最小支持度阈值和最小置信度阈值的规则称为强规则。对于给定的一个事务集D,挖掘关联规则就是支持度和可信度分别大于用户给定的最小支持度和最小可信度的强关联规则。 (五)关联规则挖掘在卫生信息分析中的实例 (一)聚类分析的定义 聚类分析(cluster analysis)是将一组物理的或抽象的对象,根据它们之间的相似程度,分为若干组,使得同一个组内的数据对象具有较高的相似度,而不同组中的数据对象是不相似的。 聚类分析与分类不同: 对于分类问题,事先了解训练样本的分类属性,将数据对象分到不同的已知类中,如在人口统计中将每个调查对象分类到老年组、中年组等;而聚类分析,则是在划分的分类体系未知的情况下,将数据对象分组成不同类,需在训练样本中找到这个分类属性。 (二)聚类分析的基本步骤 1.计算对象

文档评论(0)

1亿VIP精品文档

相关文档