- 4
- 0
- 约1.82千字
- 约 5页
- 2017-02-13 发布于重庆
- 举报
浅谈如何基于云计算实现数据挖掘
浅谈如何基于云计算实现数据挖掘
随着电信行业的发展,电信运营商之间的竞争也愈发激烈。为了在竞争中获取胜利,正确的商业策略成为成功的关键环节。拥有海量用户数据信息,利用数据挖掘技术,可在计费数据、业务订购数据、网管数据等海量用户数据中发现商业,为市场的精准营销打下基础。基于单一节点的数据挖掘系统在处理海量数据集时存在计算瓶颈随着用户规模的扩大及对应用目标的多样需求,数据挖掘应用面临了新的挑战基于云计算技术的数据挖掘方法将大数据集和挖掘任务分解到多台计算机上并行处理.在对经典Apriori算法MapReduce化后建立了一个基于Hadoop开源框架的并行数据挖掘平台,在集群中使用云计算技术处理大数据集,提高数据挖掘的效率基于云计算的并行数据挖掘工具平台包括三个层次,依下而上为分布式计算层,数据挖掘平台层以及业务应用层,具体来讲(1)分布式计算平台层:包括三部分功能:?分布式文件系统:提供分布式数据文件存储功能,提供具备高可靠性、高稳定性的存储平台;并行编程环境:提供基于Mapreduce的变成模型,及任务调度、任务执行、结果反馈等功能;及向平台提交作业功能;分布式系统管理:实现对平台的分布式系统管理。(2)数据挖掘平台层:包括五部分功能:工作流模块:实现对各个数据挖掘步骤及模块总控、调度功能;数据加载模块:将源数据从其他外设中倒入云计算平台的DFS系统;并行ETL模块:对原始
您可能关注的文档
最近下载
- 2025年大竹中学入学试卷及答案.doc VIP
- 橡胶沥青类防水涂料.docx VIP
- 大竹中学2025年小升初语文试卷及答案.docx VIP
- 制造业企业质量管理能力评估规范T_CESA 1281-2023 T_CCSA 458-2023 T_CFEII 0012-2023 T_CMIF 900-2023 T_CISA 341-2023 T_CPCIF 0286-2023.pdf VIP
- 2026年福建省初中学业水平考试模拟测试(二)(含答案).pdf VIP
- DB11∕T 194-2018 罗非鱼养殖技术规范.docx VIP
- DB13T 687-2005 肉鹅饲养管理技术规程.pdf VIP
- 2023年江苏省常州市中考化学试题卷(含标准答案)+2022年化学试卷及答案.docx
- DB13T 741-2005 新几内亚凤仙生产技术规程.pdf VIP
- DB13T 743-2005 蝴蝶兰生产技术规程.pdf VIP
原创力文档

文档评论(0)