Apriori算法实验报告材料.pdf

实用标准文案 题 目 Apriori 算 法 实 现 学 生 姓 名 学 生 学 号 专 业 班 级 指 导 教 师 2014-12-27 文档大全 实用标准文案 实验一 Apriori 算法实现 一、 实验目的 1. 加强对 Apriori 算法的理解; 2. 锻炼分析问题、解决问题并动手实践的能力。 二、 实验要求 使用一种你熟悉的程序设计语言,如 C++ 或 Java ,实现 Apriori 算法,至 少在两种不同的数据集上比较算法的性能。 三、 实验环境 Win7 旗舰版 + Visual Studio 2010 语言: C++ 四、 算法描述 1 、 Apriori 算法说明 在 Apriori 算法中,寻找频繁项集的基本思想是: A. 简单统计所有含一个元素项目集出现的频率, 找出不小于最小支持度的 项目集 , 即频繁项集; B. 从第二步开始,循环处理直到再没有最大项目集生成。循环过程是 : 第 k 步中 , 根据第 k-1 步生成的频繁 (k-1) 项集产生侯选 k 项集。根据候选 文档大全 实用标准文案 k 项集,算出候选 k 项集支持度,并与最小支持度比较 , 找到频繁 k 项 集。 下文中遇到的以下符号 ,分别代表相应的内容 k-itemset k 项集 Lk 频繁 k 项集 Ck 侯选 k 项集 2 、 Apriori 算法描述 数据结构说明 double minsup; // 设置最小支持度 mapstring,int items_count; // 统计各个项集的数目 vectorvectorstring datavec; // 原始数据项集 vectorvectorstring candidatevec; // 候选项集 vectorvectorstring frequentvec; // 频繁项集 ofstream outFile; int round=1; // 生成项集轮次 long trancount=0; // 原始事务总数 // 判断某个项目在某一个事务中是否存在,存在则值为 1,反之为 0 vectormapstring,bool bitmap; Apriori 算法的第一步是简单统计所有含一个元素的项集出现的频率,来决 定频繁 1 项集。在第 k 步,分两个阶段:1,用函数 genCanItemsetK ,通过第 (k-1) 文档大全 实用标准文案 步中生成的频繁 (k-1) 项集来生成侯选 k 项集;2. 计算侯选 k 项集的支持度, 并找 出频繁 k 项集。 Apriori 算法描述如下 getOriData(); // 获取原始数据集,并统计事务个数 genCanItemset1(); // 产生输出候选 1 项集

文档评论(0)

1亿VIP精品文档

相关文档