数据挖掘关联规加权算法研究与改进.pdfVIP

  • 2
  • 0
  • 约6.8万字
  • 约 60页
  • 2015-12-23 发布于四川
  • 举报

数据挖掘关联规加权算法研究与改进.pdf

数据挖掘关联规加权算法研究与改进

摘要 数据挖掘能够从大型数据库中提取或“挖掘”出人们有用的知识, 甚至利用已有的数据对未来事物的变化趋势进行预测,关联规则是数 据挖掘领域中的一个主要的研究内容,用于表明数据项集之间的规则 或模式联系。本文正是对基于经典Apriori的加权关联规则挖掘算法 进行研究,并将研究成果应用到电子商务推荐系统中。 本文首先概述了数据挖掘及关联规则的相关基础知识,重点剖析 概率小但重要性高的项目可能生成过多无趣关联规则的缺陷,引入权 值思想,避免重要事物被忽略的可能性;研究加权关联规则挖掘算法 中通用的定义和模型,引入k-支持期望作为剪枝过程的依据,克服了 加权算法不收敛性的缺陷;针对常规关联规则算法的缺陷一一重复扫 描目标数据库且生成大量不必要的候选项集,引入矩阵思想,减低时 间的消耗及空间的占用。基于以上两点提出基于矩阵的加权关联规则 模型及算法:利用矩阵运算求和计算项集支持数,不需要扫描数据库, 对数据库的总体扫描次数减至一次;将加权支持度的计算模型进行变 形处理

文档评论(0)

1亿VIP精品文档

相关文档