数据挖掘中关联规则Apriori算法①.PDFVIP

  • 5
  • 0
  • 约1.29万字
  • 约 4页
  • 2019-04-08 发布于天津
  • 举报
数据挖掘中关联规则Apriori算法①.PDF

2013 年 第 22 卷 第 4 期 计 算 机 系 统 应 用 ① 数据挖掘中关联规则Apriori 算法 1 2 亓文娟 , 晏 杰 1(武夷学院 数学与计算机系, 武夷山 354300) 2(武夷学院 团委, 武夷山 354300) 摘 要: 深入研究关联规则算法, 针对Apriori 算法瓶颈问题提出了一种改进算法, 该算法在构建向量矩阵的基础 上, 只需要扫描一次事务数据库, 通过优化连接和剪枝, 提高了算法的运行效率. 研究和实验表明, 改进后的算 法在大规模的事务数据库中, 较 Apriori 算法有明显的优势. 关键词: 关联规则; Apriori 算法; 向量矩阵 Apriori Algorithm of Association Rules in Data Mining 1 2 QI Wen-Juan , YAN Jie 1(Mathematics and Computer Science department, Wuyi University, Wuyishan 354300, China) 2(Youth League Committee, Wuyi University, Wuyishan 354300, China) Abstract: In this paper, study of the association rules algorithm, aiming at the bottleneck problem of Apriori algorithm an improved algorithm is proposed. The algorithm on the basis of building a vector matrix, only need to scan a transaction database by optimizing the connections and pruning to improve the operating efficiency of the algorithm. Research and experiments show that the improved algorithm in a large-scale transaction database than Apriori algorithm has obvious advantages. Key words: Association rules; Apriori algorithm; vector matrix 数据挖掘(Data Mining)就是从数据库中发现知 1 相关概念和理论 识(KDD) 、数据分析、数据融合(Data Fusion) 以及决 1.1 关联规则概念 策 支 持等 . 关 联规 则的概 念 和模 型是 首先 由 (1) 设 I=[i1,i2,,i3,… in]项的集合. 设任务相关的 R.Agrawal 等人在 1993 年提出来的, 是对一个事物 数据集 D 是事务数据库的集合, 其中每个事务 T 是项 和其它事物的相互依存和相互关联的一种描述. 针 目的集合, 使得 TÍI. 每一个事务有一个表示符, 称作 对数据而言是发现数据中项集之间潜在的关联或依 TID. 事务 T 包含一个项目集 A 当且仅当 AÍT, 一个 赖联系. 关联规则挖掘算法最经典的算法 Apriori 算

文档评论(0)

1亿VIP精品文档

相关文档