- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
二 二 群争料落,” 召纷,书哭 爆
犷
杖仪济市场 技 月片月卜台 二霍
一种 快速挖掘模糊 频繁项集 的方法
蔡高 明
(福建省涓洲湾职业技术学院,福建 莆田 351 254)
摘 要: 文章针对快速挖掘模糊频繁项集问题,提出了一个基于fp一树的快速算法 「P.「该算法提高了快速挖掘模糊频繁
项集的时空效率。实验表明,该算法的执行效率较Apriro i 算法或类ArP j ro i 算法算法有着明显改进。
关键词:数据挖掘;模糊关联规则; fp一树:
中图法分类号 TP3 11. 13 1
引言 定义5 最小支持率为口画与最小可信度为树 ‘。若满足
由于客观世界的多样性和复杂性,人们对许多事物的理解 口A( 八B用) 临 ,例AO/B D) ‘,则AO B为模糊关联规
并不能用一些精确的概念进行概括 ,而只能用一些模糊的概念 则 。
进行抽象。这样 ,若仍然使用精确关联规则挖掘算法对这些数据 定义6 1频繁模糊模式集合 卜={筑八A2. 二八Ai l口A( IAA2.
源进行关联规则挖掘 ,就不会得到预期的效果 。 二八A四 卜口‘}. L=u 乌,称为频繁模糊模式集合.
现实世界里存在大量的模糊现象,其概念的描述没有明确
定理 1模糊项 目集X 的支持度为SuP 因,若 v y ‘x 叨有
的外延,因而出现了或这或那的现象。为了解决这个问题 ,196 5
SUP( Y) 之 SUP( x) ;若v z Q 尤则有 翻峨2) ‘护(幻
年,LA. 扎德创立了模糊集合论,在近05 年的发展过程中,模糊
证明: 由模糊项 目集的定义,显然可证之。
数学发展迅速,其研究成果涉及人工智能,模糊控制,模糊推理,
性质 1 若模糊项 目集 X 是频繁的,v y 二万则 丫也是频繁的。
模糊识别等领域川。模糊关联规则,就是基于模糊概念表示数据 性质2 若模糊项 目集X 是非频繁的,咒 二x ,则2 也是非
的关联关系。为此 ,一些学者也提出一些模糊频繁项集的挖掘算 频繁的。
法。但是,目前模糊频繁项集的挖掘算法大都是采用Apri ori 算 由以上的两个性质可知,我们可以用A户ri rio 算法对上述的
法仪3域者改进的Apri 丽算法。虽然在许多情况下,Aprio ri 算法 数值型数据库进行模糊频繁集的挖掘。在许多情况下,Aprio ri
的候选产生 - 一 检查方法大幅度压缩了候选项集的大小 ,并导 算法大幅度压缩了候选项集合的大小,并导致很好的性能。但
致很好的性能。然而,它有两种开销并非微不足道: ( )1 它可能需 ArPi rio 算法也有缺点:它需要产生大量的候选项集; 同时需要重
要大量候选项集。(2) 它可能需要重复地扫描数据库 ,通过模式 复扫描数据库,因此影响了算法的效率。为此,我们结合饰-
匹配检查一个很大的候选集合。而采用饰一增长模式能以有效 增长算法的思想,提出了FFP
文档评论(0)