- 1
- 0
- 约1.3万字
- 约 92页
- 2017-05-31 发布于湖北
- 举报
2001-8-15 第4章 序列模式挖掘算法 主要内容 序列模式挖掘简介 序列模式挖掘的应用背景 序列模式挖掘算法概述 GSP算法 PrefixSpan算法 Disc-all算法 支持约束的序列模式挖掘 一、序列模式挖掘简介 序列模式的概念最早是由Agrawal和Srikant 提出的。 动机:大型连锁超市的交易数据有一系列的用户事务数据库,每一条记录包括用户的ID,事务发生的时间和事务涉及的项目。如果能在其中挖掘涉及事务间关联关系的模式,即用户几次购买行为间的联系,可以采取更有针对性的营销措施。 事务数据库实例 例:一个事务数据库,一个事务代表一笔交易,一个单项代表交易的商品,单项属性中的数字记录的是商品ID 序列数据库 一般为了方便处理,需要把数据库转化为序列数据库。方法是把用户ID相同的记录合并,有时每个事务的发生时间可以忽略,仅保持事务间的偏序关系。 问题定义 项集(Itemset)是所有在序列数据库出现过的单项组成的集合 例:对一个用户购买记录的序列数据库来说,项集包含用户购买的所有商品,一种商品就是一个单项。通常每个单项有一个唯一的ID,在数据库中记录的是单项的ID。 问题定义 元素(Element)可表示为(x1x2…xm), xk(1 = k = m)
您可能关注的文档
最近下载
- 陕西电网黑启动方案探究.pdf VIP
- 《我们是共产主义接班人》注音版歌词.doc VIP
- 全国现场流行病学调查职业技能竞赛考试题及答案.doc VIP
- 新译林版高中英语选择性必修一 unit 3词汇默写本.docx VIP
- 2025年四川省从“五方面人员”中选拔乡镇领导班子成员考试历年参考题库含答案详解.docx VIP
- 《环境监测员》职业标准(2026年版).pdf VIP
- 空气调节用制冷技术部分课后题及答案.docx VIP
- 考虑柔性负荷的多能互补园区综合能源储能容量配置方法.pdf VIP
- 公路养护公司有限空间作业安全应急救援预案.docx
- 2025年江苏省淮安市中考数学真题(含答案).pdf
原创力文档

文档评论(0)