海量数据上挖掘关联规则并行算法.pdfVIP

  • 2
  • 0
  • 约2.38万字
  • 约 7页
  • 2017-08-31 发布于安徽
  • 举报
第36卷第5期 哈尔滨工业大学学报 V01.36No.5 2 0 0 4年5月 OFHARBININSTITUTEOFTECHNOLOGYMay,2004 JOURNAL 海量数据上挖掘关联规则的并行算法 张兆功1’2,李建中1’2,张艳秋2 2.哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001) 摘 要:针对目前关联规则挖掘算法中数据库规模很大时算法执行时间太长的问题.指出了并行计算是解 决该问题的一个有效方法.利用新提出的可以忽略仅仅在少于l/4的结点机上的局部频繁项集,给出了一种 新的并行随机抽样方法,并利用机群并行计算机的自治能力和L/0高度并行的特点,提高了抽样算法对海量 数据的处理能力和效率.理论分析和实验数据显示,该算法的加速比接近于处理机的个数p,通信复杂性为 处理机的个数p的对数,具有良好的扩展性和海量处理能力,且精确度较高. 关键词:关联规则;海量数据;并行计算;控

文档评论(0)

1亿VIP精品文档

相关文档