大数据技术概述课堂.pptVIP

  • 5
  • 0
  • 约4.74千字
  • 约 49页
  • 2020-08-07 发布于天津
  • 举报
关联规则( Association ) ? 反映一个事件和其他事件之间依赖或关联的知识 ? 如果两项或多项属性之间存在关联,那么其中一项的属性 值就可以依据其他属性值进行预测 ? 可以用关联规则的形式表示 ? 规则形式: “ A ??? [support, confidence] ” . ? 应用: ? 业务相关性分析 ? 交叉销售 ? 货架摆放位置 ? 页面结构设计等 ? Pa ge3 1 ? ? 挖掘顺序发生的事件中的模式 ? 给定序列数据库和最小支持度阈值,序 列模式挖掘就是要找出序列数据库中所有 的序列模式 序列模式挖掘 ? Pa ge3 2 ? 序列模式挖掘 ? 应用: ? 用户访问模式预测 ? 用户移动模式挖掘 ? 用户点击流分析 ? DNA 序列分析 ? 自然灾害预测 ? 疾病病症预测 ? …… ? Pa ge3 3 ? 聚类( Clustering ) ? 最大化类内的相似性、最小化类间相似性的原则进行聚类或者分 组,使得在一个类中的对象具有很高的相似性,而与其他类中的 对象很不相似 ? 簇( Cluster ) : 一个数据对象的集合 ? 在同一个类中,对象之间具有相似性 ? 不同类的对象之间是相异的 ? 聚类分析: 把一个给定的数据对象集合分成不同的簇 ? 特点:一种无监督分类法,没有预先指定的类别 ? Pa ge3 4 ? ? Pa ge3 5 聚类挖掘的应用

文档评论(0)

1亿VIP精品文档

相关文档