序列模式挖掘技术应用在货物流向分析中应用.pptVIP

  • 0
  • 0
  • 约小于1千字
  • 约 3页
  • 2019-10-13 发布于广东
  • 举报

序列模式挖掘技术应用在货物流向分析中应用.ppt

利用序列模式挖掘技术可以对物流中的路径数据进行分析 挖掘 找出频繁出现的路径信息 以发现物流市场上的货物流向及未来可能出现的变动 UGSP 算法利用序列数据库 S 产生长度为 1 的候选序列C1 然后扫描数 据库 S 对 C1 中每个项的出现次数计数 确定频繁 1-序列 L1 同时将不满 足最小支持度条件的项从 S 中删除并且将项数少于 2 的序列从 S 中删除 产生过度候选 2-序列C‘2 然后由 C’2 产生长度为 2 的候选序列 C2 可见 UGSP 算法第一次遍历原始数据库之后就不再扫描原始数据库来计 算支持度 而通过过度序列集合 C‘k 计算 并且利用频繁序列 Lk-1 对 C’k 进行筛选 将不符合最小支持度的元素从 C‘k 中删除 最后将项数 小于或等于 k-1 的事务删除以缩小 C‘k 这样大大减少了候选 2-序列 C2 数目有效的缩减序列数据库 并减少了扫描原始数据库的次数 提高了算法 效率 * 设物流企业对货物 A进行操作,考虑时间和公司编号等相关属性收集路径信息,转换后得到路径序列数据库D.如表2所示 min_sup=2,采用UGSP算法 扫描序列数据库,找出C1 去掉天津,杭州.并删除路径数据库中包含天津杭州的项,更新路径数据库 Sid=1的路径序列中去掉天津,就成为只有一个元素的序列,不该出现在C2,同样sid=3的路径缩减为包含3个元素的序列,然后生成长度为2的过度候选路径序列C‘2 重复以上步骤 没有长度为3的 频繁路径产生

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档