- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数据仓库与数据挖掘》实验指导书
第 PAGE 72页
《数据挖掘与数据仓库》课程
实验指导书
2020年
计算机与数据科学学院
实验1 Apriori算法实现
一、实验目的
1、掌握Apriori算法对于关联规则挖掘中频繁集的产生以及关联规则集合的产生过程;
2、根据算法描述编程实现算法,调试运行。并结合相关实验数据进行应用,得到分析结果。
数据和删除数据的操作。
实验类型:综合
计划课间:3学时
二、实验内容
1、频繁项集的生成与Apriori算法实现;
2、关联规则的生成过程与规则算法实现;
3、结合样例对算法进行分析;
三、实验步骤
编写程序完成下列算法:
1、Apriori算法
输入: 数据集D;最小支持数minsup_count;
输出: 频繁项目集L
L1={large 1-itemsets}
For (k=2; Lk-1≠Φ; k++)
Ck=apriori-gen (Lk-1); // Ck是k个元素的候选集
For all transactions t∈D do
begin Ct=subset(Ck,t); //Ct是所有t包含的候选集元素
for all candidates c ∈Ct do c.count++;
end
Lk={c ∈Ck| c.count ≧ minsup_count }
End
L=∪Lk;
2、apriori-gen (Lk-1) 候选集产生算法
输入: (k-1)-频繁项目集Lk-1
输出: k-频繁项目集Ck
For all itemset p∈Lk-1 do
For all itemset q∈Lk-1 do
If p.item1=q.item1, p.item2=q.item2, …,p.itemk-2=q.itemk-2, p.itemk-1q.itemk-1
then
begin c=p∞q
if has_infrequent_subset(c, Lk-1)
then delete c
else add c to Ck
End
Return Ck
3、has_infrequent_subset(c, Lk-1)
功能:判断候选集的元素
输入: 一个k-频繁项目集Lk-1 ,(k-1)-频繁项目集Lk-1
输出:c是否从候选集中删除的布尔判断
For all (k-1)-subsets of c do
If Not(S∈Lk-1) THEN return TRUE;
Return FALSE;
4、Rule-generate(L,minconf)
输入:频繁项目集;最小信任度
输出:强关联规则
算法:
FOR each frequent itemset lk in L
generules(lk,lk);
5、Genrules递归算法:
Genrules(lk:frequent k-itemset, xm:frequent m-itemset)
X={(m-1)-itemsets xm-1 | xm-1 in xm};
For each xm-1 in X
BEGIN conf=support(lk)/support(xm-1);
IF (conf≧minconf) THEN
BEGIN
输出规则:xm-1-(lk-xm-1),support,confidence;
IF (m-1)1) THEN genrules(lk,xm-1);
END;
END;
结合相关样例数据对算法进行调试,并根据相关实验结果对数据进行分析,
四、实验报告要求
1、用java语言实现上述相关算法。
2、改造参考代码,添加最小置信度约束条件,并实现算法
3、在报告中详细写出实验操作步骤和实验结果,实验中出现的问题和解决方法。
五、注意事项
1、集合的表示及相关操作的实现;
2、项目集的数据结构描述;
参考核心代码如下:(相关的测试main函数可以自己书写。根据频繁k项集生成关联规则相对简单,只通过最小支持度从频繁K项集中找到所有的满足条件的关联规则。)
public class Apriori
{
private static final double MIN_SUPPROT = 0.2;//最小支持度
private static boolean endTag = false;
您可能关注的文档
最近下载
- (高清版)B 26410-2011 防爆通风机.pdf VIP
- 新技术揭细菌生物被膜结构细节.pdf VIP
- 国家标准 GBT 895.2-1986 轴用钢丝挡圈.pdf VIP
- 景观标准做法手册(硬景篇).docx VIP
- HGT 3973-2023 一般用途钢丝绳芯阻燃输送带.pdf VIP
- 2023-2024学年浙江省嘉兴市高一下学期6月期末地理试题(解析版).docx VIP
- 2025年山东黄金集团井下技能工人招聘(2025人)笔试历年参考题库附带答案详解(10卷合集).docx
- SL 339-2006水库水文泥沙观测规范.pdf
- 抽搐护理常规.pptx
- 深圳市南山外国语学校新初一分班英语试卷含答案.doc VIP
文档评论(0)