网站大量收购闲置独家精品文档,联系QQ:2885784924

带通配符的序列模式挖掘算法研究-计算机系统结构专业论文.docx

带通配符的序列模式挖掘算法研究-计算机系统结构专业论文.docx

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
带通配符的序列模式挖掘算法研究-计算机系统结构专业论文

带通配符的序列模式挖掘算法研究 摘 要 序列模式挖掘是数据挖掘的一个重要研究领域,其中带通配符约束的 序列模式挖掘越来越受到人们的关注。带通配符的频繁序列模式挖掘,是 传统频繁序列模式挖掘的自然推广,它允许挖掘出的频繁模式中含有通配 符,使得人们可以挖出具有特定特征的序列模式。带通配符的频繁模式挖 掘不仅具有理论研究价值,而且在文本索引、数据流挖掘、生物领域等领 域有着巨大的应用价值。本文以提高序列模式的挖掘效率为目的,分别针 对不同类型数据库,研究高效的带通配符约束的序列模式挖掘算法。 本文的研究内容以及相关工作包括以下几个方面: 1) 首先介绍并分析了三类经典的序列模式挖掘算法:基于 Apriori 性 质算法、基于模式增长的算法以及基于比较思想的算法,这些算法是带约 束限制的序列模式挖掘算法的基础。分析了序列模式挖掘算法在引入通配 符约束的可行性,详细介绍了已有的带通配符 约束的序列模式挖掘算法 Gap-Bide 和 MPP,其中前者基于高效的模式增长思想,后者基于 Apriori 算法引入的和候选集合产生和测试思想,并作出评价。 2) 提出了一种基于模式增长和序列迭代比较的 PreDisc-all 算法,将 其应用到带通配符的序列模式挖掘中,可以分别应用于序列数据库和一条 单序列中挖掘序列模式。实验表明,在平均长度较短的序列数据库中或者 单序列中,挖掘具有通配符约束的较短的频繁序列模式,该算法在时间效 率上有着不错的表现。 3) 设计和实现了带通配符约束的算法实验系统。 关键词:序列模式挖掘,数据挖掘,通配符,约束 Research on Algorithm of Mining Sequential Patterns with Wildcards Abstract Sequential pattern mining is an important field of data mining research. In recent years, people pay more and more attention in mining sequential patterns with wildcards constraint. Mining frequent sequential patterns with wildcards, which is a natural extension of traditional frequent sequential pattern mining, can find out specific sequential patterns specified by wildcards. Mining frequent patterns with wildcards not only has a theoretical value, but also has a great application value in the text index, data stream mining, biotechnology and other areas of the field. In order to increase the efficiency of mining sequential patterns in different types of databases, this dissertation studied efficient algorithms for sequential pattern mining with wildcards constraint. The main work and novel parts of this dissertation are: We introduced and analyzed three kinds of classic sequential pattern mining algorithms including algorithms based on Apriori character, algorithms based on pattern growth, and algorithms based on comparing idea, which are the base of sequential pattern mining algorithms with wildcards. We analyzed the feasibility of sequential pattern mining algorithm with wildcards constraint, and introduced and evaluated two

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档