- 4
- 0
- 约1.12万字
- 约 7页
- 2017-08-17 发布于河北
- 举报
一种基于图形处理器的频繁模式挖掘算法.doc
一种基于图形处理器的频繁模式挖掘算法2 吉林大学符号计算与知识工程教育部重点实验室频繁模式挖掘是数据挖掘的核心问题传统上频繁模式并行挖掘主要是在集群上进行的较少涉及共享内存多处理系统上的并行挖掘。基于广度优先搜索和直接计数策略研究了一种并行挖掘方法,并在图形处理器(graphics process unit, GPU)最新统一计算设备架构CUDA(compute unified device architecture)下进行了实现。GPU-based FPMA用CPU控制搜索进程在GPU的多处理器上采用数据的计算策略以适合GPU的顺序数据流方式计数并根据候选项的长度动态剪枝事务数据集。实验结果表明GPU-based FPMA比CPU版本平均加速了10倍以上。关联规则频繁模式图形处理器并行计算统一计算设备架构TP311.1 文献标识码:A 国家标准学科分类代码:520.3020
GPU-based frequent pattern mining algorithm
Bai Hongtao1,2, Ouyang Dantong1,2, He Li1i1,2
(1 College of Computer Science and Technology, Jilin University, Changchun 130012, China; Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education, Jilin University, Changchun 130012, China)
AbstractFrequent pattern mining is an important issue in data mining area. Traditionally, parallel frequent pattern mining is carried out in PC clusters, and seldom related to multi-processors or massive cores with shared memories. In this paper, we propose a parallel frequent pattern mining algorithm suitable for GPU (graphics processing unit) based on width search and direct support strategy. It is implemented under compute unified device architecture (CUDA) of GPU. In this algorithm, CPU takes charge of search process and GPU is responsible for counting using data partition. In addition, transactions are dynamically pruned according to the length (k) of candidate frequent itemsets. Performance analysis shows that GPU-based FPMA reaches an average speed as fast as that of 10 times of CPU-based counterpart.
Key words:association rule; frequent pattern; GPU; parallel computing; CUDA
1 引 言
自关联规则挖掘[1]的概念提出以来,频繁模式挖掘算法的发展得到了相当多的关注,在关联规则挖掘、推理数据库和查询扩展等方向应用众多。面对日益增长、特征各异的数据集,算法面临的一个基本问题是如何保证高效运行。基于对算法效率瓶颈的理解和问题解决方案,产生了多种代表性算法,如Apriori[2]Partition[3]、Eclat[4]、Fp-growth[5]等。其中除Fp-growth是一种典型的模式增长类算法,其他种都是候选-计数模型类算法。其后,诸多算法对原始算法或进行改进,或衍生变种,如AprioriTid、SFP、Prefix-trees等[37]。这些频繁模式挖掘算法针对最小化扫描数据的次数、最小化维护数据结构的成本、最小化分析的候选集的数量、最小化计算每个候选集支持度的时间等个或几个方面进行优化。近年来,对频繁模式的关注也从经典频繁模式挖掘,扩
您可能关注的文档
- 2014年6月中国空调线上零售市场销售情况分析简报.pdf
- 2014年上半年度中国空调线上零售市场销售情况分析简报.pdf
- 3-1计划的进一步审计程序表.xls
- 42 审计师考试知识点总结-财务管理公式.xls
- 50种动物折纸图解.pdf
- 70个大中城市房屋销售价格指数(05年-10年).xls
- 71309新闻史论.pdf
- 8051单片机看门狗原理和C语言演示程序(以STC89C52RC单片机为例).pdf
- 8928 钢铁制件机械镀锌.pdf
- ADVIA2120血液分析仪常用实验动物血液白细胞分类性能评价.pdf
- 广东省广州省实验中学教育集团2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州大学附属中学2025-2026学年八年级上学期奥班期中物理试题(解析版).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(含答案).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(解析版).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 2026《中国人寿上海分公司营销员培训体系优化研究》18000字.docx
- 《生物探究性实验教学》中小学教师资格模拟试题.docx
最近下载
- 组织生活会前征求意见和建议的情况报告集合.docx VIP
- 2020年全国高考全国一卷英语真题(含解析).pdf VIP
- _中国男性乳腺癌临床诊治实践指南(2023版).pdf VIP
- 标准图集-17J008 挡土墙(重力式、衡重式、悬臂式) 无水印.pdf VIP
- 管理沟通——原理、策略及应用(第三版)课件全套 赵洱岽 第1--14章 管理沟通概论---数字化时代的沟通.pptx
- 初二物理上册质量与密度练习题难题带答案1.pdf VIP
- DB31_T 416-2008 城市道路路名牌(法规规范).pdf VIP
- V83-CV100出入口车牌识别高清网络一体化摄像机操作手册20180427.pdf VIP
- 《再别康桥》优秀课件.ppt VIP
- 2026届高考政治总复习选必一高考主观试题答题模型总结(2023-2025年真题适配版).pdf VIP
原创力文档

文档评论(0)