- 1、本文档共57页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
带通配符的序列模式挖掘算法研究-计算机系统结构专业论文
带通配符的序列模式挖掘算法研究
摘 要
序列模式挖掘是数据挖掘的一个重要研究领域,其中带通配符约束的 序列模式挖掘越来越受到人们的关注。带通配符的频繁序列模式挖掘,是 传统频繁序列模式挖掘的自然推广,它允许挖掘出的频繁模式中含有通配 符,使得人们可以挖出具有特定特征的序列模式。带通配符的频繁模式挖 掘不仅具有理论研究价值,而且在文本索引、数据流挖掘、生物领域等领 域有着巨大的应用价值。本文以提高序列模式的挖掘效率为目的,分别针 对不同类型数据库,研究高效的带通配符约束的序列模式挖掘算法。
本文的研究内容以及相关工作包括以下几个方面:
1) 首先介绍并分析了三类经典的序列模式挖掘算法:基于 Apriori 性 质算法、基于模式增长的算法以及基于比较思想的算法,这些算法是带约 束限制的序列模式挖掘算法的基础。分析了序列模式挖掘算法在引入通配 符约束的可行性,详细介绍了已有的带通配符 约束的序列模式挖掘算法 Gap-Bide 和 MPP,其中前者基于高效的模式增长思想,后者基于 Apriori 算法引入的和候选集合产生和测试思想,并作出评价。
2) 提出了一种基于模式增长和序列迭代比较的 PreDisc-all 算法,将 其应用到带通配符的序列模式挖掘中,可以分别应用于序列数据库和一条 单序列中挖掘序列模式。实验表明,在平均长度较短的序列数据库中或者 单序列中,挖掘具有通配符约束的较短的频繁序列模式,该算法在时间效 率上有着不错的表现。
3) 设计和实现了带通配符约束的算法实验系统。 关键词:序列模式挖掘,数据挖掘,通配符,约束
Research on Algorithm of Mining Sequential Patterns with Wildcards
Abstract
Sequential pattern mining is an important field of data mining research. In recent years, people pay more and more attention in mining sequential patterns with wildcards constraint. Mining frequent sequential patterns with wildcards, which is a natural extension of traditional frequent sequential pattern mining, can find out specific sequential patterns specified by wildcards. Mining frequent patterns with wildcards not only has a theoretical value, but also has a great application value in the text index, data stream mining, biotechnology and other areas of the field. In order to increase the efficiency of mining sequential patterns in different types of databases, this dissertation studied efficient algorithms for sequential pattern mining with wildcards constraint.
The main work and novel parts of this dissertation are:
We introduced and analyzed three kinds of classic sequential pattern mining algorithms including algorithms based on Apriori character, algorithms based on pattern growth, and algorithms based on comparing idea, which are the base of sequential pattern mining algorithms with wildcards. We analyzed the feasibility of sequential pattern mining algorithm with wildcards constraint, and introduced and evaluated two
您可能关注的文档
- 工程陶瓷旋转超声磨削边缘破损机理及实验研究-机械制造及其自动化专业论文.docx
- 工程陶瓷材料超声作用下的体积效应研究-机械工程专业论文.docx
- 工程项目不完全合同平衡点研究-工程管理专业论文.docx
- 工程项目业主索赔风险评价研究-项目管理专业论文.docx
- 工程随机激励的正交展开-随机函数模型及其应用-结构工程专业论文.docx
- 工程项目中的知识管理分析-建筑与土木工程专业论文.docx
- 工程项目中机电顾问的科学定位及有效运行机制的探究-项目管理专业论文.docx
- 工程项目中的知识管理研究-项目管理专业论文.docx
- 工程项目中设备物流方案的风险评价研究-物流工程专业论文.docx
- 工程项目主体行为风险管理研究-管理科学与工程专业论文.docx
最近下载
- 2024华医网继续教育抗菌药物的临床合理应用与专项管理题库答案.docx VIP
- 站运游一体化课件.ppt
- 2023年江西中医药大学公共课《中国近代史纲要》期末试卷A(有答案).docx VIP
- 《职业卫生与职业医学》有机粉尘及所致肺部疾患.ppt
- 利用7805及7905设计一个输出为±(5-9)V_1A的直流可调稳压电源.doc
- 化工企业生产过程异常工况安全处置管理制度.docx
- 2024山东省《强化依法执业,加强医德医风建设》题库答案(共442题).docx VIP
- 商务英语核心词汇-3000词(详解版).docx
- DIN-EN-10152-CN欧洲标准 汽车钢电镀锌 定尺加工.doc VIP
- 幼小衔接课程模式的有效性探讨教学研究课题报告.docx
文档评论(0)