序列的模式挖掘综述.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
序列的模式挖掘综述

序列的模式挖掘综述   摘 要:综述了序列模式挖掘的研究状况。首先介绍了序列模式挖掘背景与相关概念;其次总结了序列模式挖掘的一般方法,介绍并分析了最具代表性的序列模式挖掘算法;最后展望序列模式挖掘的研究方向。便于研究者对已有算法进行改进,提出具有更好性能的新的序列模式挖掘算法。??   关键词:数据挖掘;序列模式;周期模式;增量式挖掘??   中图分类号:TP311 文献标志码:A    文章编号:1001-3695(2008)07-1960-04   ??   Survey of sequential pattern mining   CHEN Zhuo,YANG Bing??ru,SONG Wei,SONG Ze??feng   ?ぃ?School of Information Engineering, Beijing University of Science Technology, Beijing 100083, China)   ??Abstract:This paper provided a review of the research of sequential pattern mining. Firstly,introduced the background and context.Secondly,summarized the general methods of sequence pattern mining,introduced and analyzedthe most representative algorithm to provide a basis for improving old algorithms or developing new effective ones. Finally,discussed some future research trends on this area.??   Key words:data mining;sequential pattern;periodic pattern;incremental mining ?お?      数据挖掘作为知识发现的核心步骤,旨在从海量数据中提取有效的、新颖的、潜在有用的、易被理解的知识。序列模式挖掘(sequential pattern mining)是数据挖掘中非常重要的一个研究领域,最早是由Rakesh Agrawal和Ramakrishnan Srikant在针对超市中购物篮数据的分析提出来的。序列模式挖掘是要找出序列数据库中所有超过最小支持度阈值的序列模式[1]。它有着广泛的应用领域:商业组织利用序列模式挖掘去研究客户购买行为模式特征、计算生物学中序列模式挖掘用来分析不同氨基酸突变模式、用户Web访问模式预测以及DNA序列分析和谱分析。序列模式挖掘与关联规则挖掘在许多方面相似,但它更关心数据之间顺序的关联性。??      1 序列模式挖掘任务定义??      基本概念:??   定义1 事务数据库(transaction database):以超市数据为例来说明,即由顾客交易记录组成的数据库。Custom_ID、Transaction_Time、Itemset分别代表顾客标志、交易时间和交易物品集合。??   定义2 项集(itemset):各个项(item)组成的集合。??   定义3 序列(sequence):不同项集的有序排列。序列??S??可以表示为??S??=??〈s??1,s??2,…,s??n??〉。其中:??s??j(1≤j≤n??)为项集,也称为序列??S??的元素。??   定义4 序列的元素(element):表示为(??x??1,x??2,…,x??n??)。其中:??x??k(1≤k≤m)??为不同的项。??   定义5 序列长度:一个序列包含的所有项集的个数,长度为1的序列记为1?残蛄小*?   定义6 序列的包含:设存在两个序列??α,β??。其中:??α=〈a??1,a??2,…,a??n〉,β=〈b??1,b??2,…,b??n??〉。如果存在整数1≤??j??1<??j??2<??…<j??n≤m,使得a??1??b????j1??,a??2??b????j2??,…,a??n??b????jn??,则称序列α是β的子序列,又称β序列包含α,记为α?力隆*???      定义7 支持数:序列??α在序列数据库S的支持数为序列数据库S中包含α??的序列个数。??   定义8 支持度:序列的支持度是一个预先设定的阈值。??   定义9 频繁序列:给定最小支持度阈值,如果序列α在序列数据库中的支持数不低于该阈值,则称序列??

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档