一种改进的Inter-Apriori算法①.PDF
2017 年 第 26 卷 第 1 期 计 算 机 系 统 应 用
一种改进的Inter-Apriori 算法①
崔双弥, 张德生
(西安理工大学 理学院, 西安 710054)
摘 要: 建立了一种基于定位和权值事务项集的挖掘算法, 该算法只需扫描一遍事务数据库. 利用垂直型布尔矩
阵来存储交易数据, 通过 “与”运算与权值来计算计算支持度, 利用定位搜索和合并事务矩阵相同列来剪枝, 从
而减少了算法在挖掘过程中使用的存储空间和计算时间. 实验结果表明, 改进算法在性能上得到了的明显提高.
关键词: 频繁项集; 垂直型布尔矩阵; Inter-Apriori 算法
Improved Inter-Apriori Algorithm
CUI Shuang-Mi, ZHANG De-Sheng
(College of Science, Xi’an University of Technology, Xi’an 710054, China)
Abstract: This paper establishes a mining algorithm based on the location and weight transaction item sets. It needs to
scan the transaction database once. The algorithm adopts the vertical Boolean matrix to store transaction data, and the
logic “and” operation and weight to calculate the support. Then it prunes through the searching location and combining
the same columns of transaction matrix. Thereby the storage space and computing time used by the algorithm in the
mining process can be reduced. The experimental results show that the improved algorithm performance has been
significantly improved.
Key words: frequent itemsets; vertical type Boolean matrix; Inter-Apriori algorithm
1 引言 基于矩阵和数组的研究方法[9,10]等,文献[11]提出了基
[1]
关联规则挖掘 是数据挖掘领域的一个重要问题, 于矩阵取交集的 Inter-Apriori 算法, 但当 Tidset 的规模
旨在发现大量数据中项集之间有趣的关联或相关联系. 庞大时将出现以下问题: (1)求 Tidset 的交集的操作将
这些关联关系可以为商业决策者提供有价值的信息, 消耗大量时间,影响了算法的效率; (2)Tidset 的规模相
从而实现商务决策的制定, 如交叉销售、商品摆放等. 当庞大, 消耗系统大量的内存. 文献[12]提出对项集矩
[2]
Apriori 算法 是挖掘关联规则最经典的算法, 阵进行累加运算, 虽能大大提高挖掘效率, 但只适用
它在执行“连接-剪枝” 的过程中采用逐层搜索的迭代
原创力文档

文档评论(0)