- 5
- 0
- 约1.29万字
- 约 4页
- 2019-04-08 发布于天津
- 举报
数据挖掘中关联规则Apriori算法①.PDF
2013 年 第 22 卷 第 4 期 计 算 机 系 统 应 用
①
数据挖掘中关联规则Apriori 算法
1 2
亓文娟 , 晏 杰
1(武夷学院 数学与计算机系, 武夷山 354300)
2(武夷学院 团委, 武夷山 354300)
摘 要: 深入研究关联规则算法, 针对Apriori 算法瓶颈问题提出了一种改进算法, 该算法在构建向量矩阵的基础
上, 只需要扫描一次事务数据库, 通过优化连接和剪枝, 提高了算法的运行效率. 研究和实验表明, 改进后的算
法在大规模的事务数据库中, 较 Apriori 算法有明显的优势.
关键词: 关联规则; Apriori 算法; 向量矩阵
Apriori Algorithm of Association Rules in Data Mining
1 2
QI Wen-Juan , YAN Jie
1(Mathematics and Computer Science department, Wuyi University, Wuyishan 354300, China)
2(Youth League Committee, Wuyi University, Wuyishan 354300, China)
Abstract: In this paper, study of the association rules algorithm, aiming at the bottleneck problem of Apriori algorithm
an improved algorithm is proposed. The algorithm on the basis of building a vector matrix, only need to scan a
transaction database by optimizing the connections and pruning to improve the operating efficiency of the algorithm.
Research and experiments show that the improved algorithm in a large-scale transaction database than Apriori algorithm
has obvious advantages.
Key words: Association rules; Apriori algorithm; vector matrix
数据挖掘(Data Mining)就是从数据库中发现知 1 相关概念和理论
识(KDD) 、数据分析、数据融合(Data Fusion) 以及决 1.1 关联规则概念
策 支 持等 . 关 联规 则的概 念 和模 型是 首先 由 (1) 设 I=[i1,i2,,i3,… in]项的集合. 设任务相关的
R.Agrawal 等人在 1993 年提出来的, 是对一个事物 数据集 D 是事务数据库的集合, 其中每个事务 T 是项
和其它事物的相互依存和相互关联的一种描述. 针 目的集合, 使得 TÍI. 每一个事务有一个表示符, 称作
对数据而言是发现数据中项集之间潜在的关联或依 TID. 事务 T 包含一个项目集 A 当且仅当 AÍT, 一个
赖联系. 关联规则挖掘算法最经典的算法 Apriori 算
原创力文档

文档评论(0)