实用标准文案
题 目 Apriori 算 法 实 现
学 生 姓 名
学 生 学 号
专 业 班 级
指 导 教 师
2014-12-27
文档大全
实用标准文案
实验一 Apriori 算法实现
一、 实验目的
1. 加强对 Apriori 算法的理解;
2. 锻炼分析问题、解决问题并动手实践的能力。
二、 实验要求
使用一种你熟悉的程序设计语言,如 C++ 或 Java ,实现 Apriori 算法,至
少在两种不同的数据集上比较算法的性能。
三、 实验环境
Win7 旗舰版 + Visual Studio 2010
语言: C++
四、 算法描述
1 、 Apriori 算法说明
在 Apriori 算法中,寻找频繁项集的基本思想是:
A. 简单统计所有含一个元素项目集出现的频率, 找出不小于最小支持度的
项目集 , 即频繁项集;
B. 从第二步开始,循环处理直到再没有最大项目集生成。循环过程是 : 第
k 步中 , 根据第 k-1 步生成的频繁 (k-1) 项集产生侯选 k 项集。根据候选
文档大全
实用标准文案
k 项集,算出候选 k 项集支持度,并与最小支持度比较 , 找到频繁 k 项
集。
下文中遇到的以下符号 ,分别代表相应的内容
k-itemset k 项集
Lk 频繁 k 项集
Ck 侯选 k 项集
2 、 Apriori 算法描述
数据结构说明
double minsup; // 设置最小支持度
mapstring,int items_count; // 统计各个项集的数目
vectorvectorstring datavec; // 原始数据项集
vectorvectorstring candidatevec; // 候选项集
vectorvectorstring frequentvec; // 频繁项集
ofstream outFile;
int round=1; // 生成项集轮次
long trancount=0; // 原始事务总数
// 判断某个项目在某一个事务中是否存在,存在则值为 1,反之为 0
vectormapstring,bool bitmap;
Apriori 算法的第一步是简单统计所有含一个元素的项集出现的频率,来决
定频繁 1 项集。在第 k 步,分两个阶段:1,用函数 genCanItemsetK ,通过第 (k-1)
文档大全
实用标准文案
步中生成的频繁 (k-1) 项集来生成侯选 k 项集;2. 计算侯选 k 项集的支持度, 并找
出频繁 k 项集。
Apriori 算法描述如下
getOriData(); // 获取原始数据集,并统计事务个数
genCanItemset1(); // 产生输出候选 1 项集
您可能关注的文档
- 建设工程施工承包规定合同书.pdf
- 建设工程项目管理系统总结材料.pdf
- 开展金融服务网格化地探索与实践.pdf
- 开标-评标相关表格.pdf
- 弱电系统维保方案设计设计.pdf
- 强夯专项施工方案设计设计.pdf
- 强夯施工方案设计设计(完整版无公式).pdf
- 快消品经销商16种盈利模式.pdf
- 快递业务承包规定合同例范本.pdf
- 快递公司管理系统分部及承包区管理系统规章制度.pdf
- G681线阿勒泰至禾木喀纳斯公路建设项目增补观景停车区等服务设施项目环境影响报告表.pdf
- 来宾韦文林建材年产100万吨机制砂项目环境影响报告表.pdf
- 合山市高端环保免漆生态板加工项目环境影响报告表.pdf
- 3.5万吨_年生物基丁二酸及衍生物高端制造项目(重新报批)报告书.pdf
- G631淮阳区王店至周西路口段新建工程报告书.pdf
- 年产12万吨装配式智能钢结构、50万套钢结构工程机械配件智能自动化生产线项目环境影响报告书.doc
- 2024年新疆维吾尔自治区福海县渔业绿色循环发展试点-生态型活鱼育肥箱系统采购项目环境影响报告表.pdf
- 广西1828大健康产业园项目环境影响报告表.pdf
- 220千伏金秀站扩建工程环境影响报告表.pdf
- 20万吨_年聚苯乙烯产品优化提升项目报告书.pdf
原创力文档

文档评论(0)