序列模式挖掘算法.pptVIP

  • 1
  • 0
  • 约5.07千字
  • 约 28页
  • 2021-07-05 发布于湖北
  • 举报
2001-8-15 序列模式挖掘算法简介 报告人:邓爱林 报告的主要内容 序列模式简介 GSP算法 PrefixSpan算法 一、序列模式简介 序列模式的概念最早是由Agrawal和Srikant 提出的 序列模式定义:给定一个由不同序列组成的集合,其中,每个序列由不同的元素按顺序有序排列,每个元素由不同项目组成,同时给定一个用户指定的最小支持度阈值,序列模式挖掘就是找出所有的频繁子序列,即该子序列在序列集中的出现频率不低于用户指定的最小支持度阈值 一、序列模式简介 例子1:在两年前购买了Ford 牌轿车的顾客,很有可能在今年采取贴旧换新的购车行动 例子2:在购买了自行车和购物篮的所有客户中,有70%的客户会在两个月后购买打气筒 一、序列模式简介 应用领域: 客户购买行为模式预测 Web访问模式预测 疾病诊断 自然灾害预测 DNA序列分析 一、序列模式简介 符号化表示: 项目集(Itemset)是各种项目组成的集合 序列(Sequence)是不同项目集(ItemSet)的有序排列,序列s可以表示为s = s1s2…sl,sj(1 = j = l)为项目集(Itemset),也称为序列s的元素 序列的元素(Element)可表示为(x1x2…xm), xk(1 = k = m)为不同的项目,如果一个序列只有一个项目,则括号可以省略 一个序列包含的所有项目的个数称为序列的长度。长度

文档评论(0)

1亿VIP精品文档

相关文档