高价值项集挖掘算法研究.pdf

摘 要 关联规则挖掘是数据挖掘领域一个重要的研究课题,传统的关联规则挖掘中只考虑 项目在事务中出现与否。然而,在一条事务中,顾客可能购买同一种商品多个,而每件 商品的利润也不尽相同。单纯基于支持度的数据挖掘可能会导致一些重要的项集因为支 持度低而不被发现。为解决这个问题,学者们提出了基于价值的项集挖掘。 通过对已有的高价值项集挖掘算法研究,发现现有的算法都是基于候选项集生成一 太多,特别是当挖掘长模式高价值项集时弊端更为明显;另外产生的候选集过大,测试 候选集是否为可能高价值项集及计算项集的价值需要花费大量的时间。为此,本文提出 Item 了一种新的数据结构:PHUI.tree(Possible HighUtility 中直接挖掘高价值项集,而不需要产生候选项集;计算项集的价值时不需要重复扫描数 据库。实验表明,DHUI算法是一个高效的高价值项集挖掘算法。 ‘ 最后,考虑到DHUI算法是基于内存的一种挖掘算法,特别是在信息高度

文档评论(0)

1亿VIP精品文档

相关文档