- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2013 2 计算机工程与设计 Feb. 2013
年 月
34 2 COMPUTER ENGINEERING AND DESIGN Vol. 34 No. 2
第 卷 第 期
基于MapReduce 的数据挖掘平台设计与实现
1,2 1 3
, ,
黄 斌 许舒人 蒲 卫
( 1. 中国科学院软件研究所 软件工程技术 中心,北京 100 190 ;
2 . 中国科学院研究生院,北京 100 190 ; 3. 解放 军卫生信息中心,北京 100842)
摘 要: MapReduce 编程模型 的简单性和 高性价 比使得其适用于海量数据 的并行处理 。然而,MapReduce 欠缺对 多数据 源、
组件复用以及数据可视化 支持,这些缺点使 用户在运用 MapReduce 框 架进行数据挖掘 时暴露 出开发效率低下 ,重复开发等
问题。提出了一种基于 MapReduce 的数据挖掘平 台的设计与 实现 ,该设计 思想为 Hadoop 作 为大规模数据 计算平 台在数据
挖掘 、数据可视化以及 商业智能应用方面的不足提供了参考与 弥补。同时,基于该方法实现 了一个大规模数据挖掘工具 。
关键词: MapReduce 编程模型; 数据挖掘; Hadoop 平 台; 模型驱动; 可视化
中图法分类号:TP301 文献标识号: A 文章编号: 1000-7024 ( 2013) 02-0495-07
Design and implementation of MapReduce-based data mining platform
HUANG Bin1,2 ,X Shu-ren1 ,PU Wei3
(1. Technology Center of Software Engineering ,Institute of Software ,Chinese Academy of Sciences ,
Beijing 100190 ,China ;2 . Graduate University ,Chinese Academy of Sciences ,Beijing 100190 ,China ;
3. Health Information Center of PLA ,Beijing 100842 ,China)
Abstract :Profiting from its simplicity and high cost performance ,MapReduce programming paradigm is suitable for massive parallel
data processing. However ,MapReduces lacking supports for multiple data source ,component reuse ,and data visua-lization bring in
problems such as low efficiency development and redundant coding. A new design and implementation of MapReduce-based data mining
platform is proposed to give reference implementation of massive data mining ,data visualiz
文档评论(0)