数据挖掘技术与联规则挖掘算法研究.pdfVIP

数据挖掘技术与联规则挖掘算法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术与联规则挖掘算法研究

摘 要 数据挖撼是致力于数据分辑翻理瓣、揭示数据内部蕴藏知 识的技术,它成为未来信息技术应用的重凄目标之一。经过十 几年的努力,数据挖掘产生了许多新概念和方法。特剐是最近 几年,~些基本摄念和方法憝于瀵壤,它灼研究正岛羞更深入 的方向发展。像其它新披术的发展历程一样,数据挖掘技术也 必须经过概念提出、概念接受、广泛研究和探索、逐步应用和 大蹩痊翔等除段。铁嚣葭戆骥状豢,大郝分学黉认为数据挖掘 的研究仍然处于广泛研究和探索阶段,追切需要在基础理论、 应用模式、系统构架以及挖掘算法和挖掘语畜等方面进行创 薪。关联筑潮挖掘是数据挖掇中成果簸丰嚣萎跑较活跃熬磷究 分支,瞬给研究者的是更深入的课题。面对大型数据瘁,关联 规则挖掘需要在挖掘效率、可用性、精确性等方面得到提升。 困诧,需要探索新静挖掘逢论和模壅;需瓣乖l用孺户的约束等 聚焦挖掘旦标;嚣要对一些传统的算法进行改进:也嚣要研究 新的更有效的算法等。鉴于爵前数据挖掘技术和关联规则挖掘 研究的现状和发展趋势。在备类蘩金的支持下,我们选择了这 一课题汗震糖关王馋。 本文的研究主要包括数据挖掘应用系统体系结构、关联规 则挖掘理论及其算法等。关于数据挖掘应用系统体系结构研究 方嚣,我翻设计了一令数据挖掘瘦瘸系统戆器型体系续梅,系 统化地分析了知识发现的基本过程和系统的各部件功能。由于 不间的源数据类型、不同的应用冈标以及不同的挖掘策略对数 据挖摇系统鳃功能舔件蝥求不霞,这麓研究主罄是麸稚诱发现 的基本过程出发,探讨系统戍具餐的主要功能部件及其相互联 系等。在关联规则挖掘理论研究上,我们首次给出了项目序列 集格空闻,并置探讨了在这个空阀上静基本搡作算子。基予顼 耳序列集格空闽及冀操住,我们慈立了关联援则挖掘模型积算 法。在关联规则挖掘算法方面,设计了基于项目序列集操作理 论的关联规则挖掘算法ISS.DM、时态约束下的关联规则挖掘 彝法TISS.DM、数据分裂下戆关联援剥撼掘算法PISS。DM。 IsS.DM算法是建立在严格的项目序列集格理论及其操作基 础上,是一个一次数据库扫描的而鼠不使用候选集的高效算 j匕京工业大掌工掌博士掌位论文 法。我们选择目前引用率较高的Apriori算法和IsS.DM进行 了对比实验。结果表明,IsS.DM执行时间整体上优于Apriori 算法,而且随着数据量的增大ISS.DM执行时间的增长幅度也 小于Apriori算法。为了提高对大型数据集挖掘的适应性,将 时态约束应用到挖掘的预处理中,改进ISS.DM成TIsS—DM。 这部分工作还包括对时态区间、时态约束下的数据挖掘空间以 及时态区间操作等进行了形式化,它们是TlSS-DM的理论基 础。对IsS.DM的另一个改进算法是PlSS.DM。它是针对大数 据集挖掘过程中对内存和CPU等系统资源要求较高的情况被 提出和设计的,采用了数据分割的方法来减少资源的占用。本 文解决了数据分割下局部频繁项目序列集和全局频繁项目序 列集的转换等问题,是一个两次扫描数据库的算法。 总之,本文在分析、归类现有数据挖掘研究成果以及原型 系统的基础上,进行了数据挖掘应用系统体系结构、关联规则 挖掘理论模型以及算法方面的研究。在项目序列集格及其操 作、时态约束挖掘空间等方面具有较好的理论价值,所设计的 算法在挖掘效率和对大型数据库挖掘的可用性方面具有潜在 的应用前景。 关键词:数据挖掘,知识发现,关联规则,项目序列集, 时态约束,数据分割。 n Abstract Data isa thataimsto and miningtechnique analyze Understandsourcedataand large reveal hidden knowledge inthedata。It hasbeenviewedasan in

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档