关联规则挖掘算法研究-计算机应用技术专业论文.docxVIP

下载本文档

1
0
约6.48万字
约 60页
2019-04-05 发布于上海
举报
版权申诉

关联规则挖掘算法研究-计算机应用技术专业论文.docx

1、本文档共60页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要 11111111111111111111111111111111111111111111111111 Y1889477 摘要随着计算机、扫描仪、数据库技术的广泛应用，人类积累了大量的数据。表面上数据库中蒋放的是简单的数据，其实数据背后隐藏了一些有价值的信息。挖掘出这些信息，可以在未来预测、企业决策、销售策略、资源管理等领域起到重要的指导作用。但是，面对海量的数据，如果仍然延用传统的数据分析方式来处理，几乎是不可能究成的，于是就产生了数据挖掘这门新的学科。关联规则挖掘作为数据挖掘的主要研究方向之…，主要用于发现数据库中项与顷之间的某种联系，从而找出有价值的信息。频繁项集挖掘作为关联规则挖掘的主要任务，其算法的效率问题一直是一个难点。本文介绍了频繁琐集挖掘的相关知识，详细分析了相关经典算法的性能，针对最大频繁项集包含了所有频繁琐集信息这…特点，文章以最大频繁琐集的挖掘作为主要研究对象，从 FP咐悦的生成、前瞻剪枝策略、超集检验、优先搜索策略、降维等多个方面对最大频繁琐集的挖掘做了深入的研究。数字频繁模式树 (DFP-tree) 是对传统的 FP-tree 的改进，本文给出了 DFP-tree 的定义及构造过程，并基于 DFP-衍ee 提出了挖掘最大频繁项集的 DFP-Max 算法。在该算法中，分析了 DFP-tree 的生成速度、基于数字序列的超集检验效率。算法还采用了前瞻剪枝策略，减少了算法的递归次数，节省了大量时空资源，提高了算法的效率，实验证明该算法耗时大约是 FPMax 算法的 20%--50% 。 …个项集中所含项的个数称为该项集的维度，文章的第五部分以逐步降低候选项集维度为指辱思想，在分析 DMFIA 和 FPMax 算法的基础上，把深度优先和宽度优先策略结合起来，提出了 BDRFI 算法。算法采用了降维和分而治之的思想解决了 DMFIA 算法产生过多候选最大繁顷集以及 FPMax 算法的需要以递归方式挖掘频繁琐集的问题，使算法的效率得到了提高。实验证明，该算法是 DMFIA 效率的 28 倍。关键词:数据挖掘;关联规则:最大频繁琐集; FP-tree; 超集检验 11 11 Abstract Abstract W仙也e wide use of computers ，sc缸mers and data base technique ，human accumulated a great deal of historical da肌These data look simple at the surface of them， but，there are much valuable information behind them. In data prediction ，business decision and reso山ce management ，the knowledge and rule behind these data are very useful.But，if we still use traditional methods of statistical and analyses，these useful information cant be discovered or can be found in infinite time. Hence data mining has been proposed on this occasion. As one of the main research pa忧:ems in the field of data mining，association rules are used to determine 阳relationships of a set of item，ωfind out valuable information. Frequent item mining ，the main task of 也.e association rule mining，the efficiency of which 扭曲e difficult problem. In 由is paper，relevant knowledge of frequent itemset mining is introduced and some classic algorithms are analyzed in detail.For the maximum 仕equent contains all the 企equent itemsets，由is paper focuses on how to minin