大数据开发平台的搭建
什么是大数据
大数据(big data),是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
大数据
3
大数据处理的需求和特点
大数据平台目标架构
准实时采集
批量采集
Hadoop平台
MPP,基于X86平台
主数据仓库
分布式数据库
基于x86平台
数据采集(云化ETL,流数据处理、爬虫)
数据层
获取层
能力层
精细化营销
智能运营
物联网应用
应用商店
客服应用
基础分析能力
数据挖掘能力
实时分析能力
自助分析能力
多维分析能力
数据共享能力
指标应用
报表应用
主题分析
专题分析
互联网
GN口
半结构化、非结构化数据
BSS
经分
DM
VAC
MC话单
业务平台
结构化数据
数据源
分布式文件系统 HDFS
记录明细数据
HBase
M/R
Hive
记录汇总数据
数据统一服务
您可能关注的文档
- 第六章校园网络布线设计与实现.pptx
- 第1章第0节水生生物学绪论及藻类概述.pdf
- 12.2 热量与热值.ppt
- 大气污染治理行业.doc
- 12.2.1三角形全等的判定SSS.ppt
- 12.2~2热量和热值.ppt
- 12.2+热量、热值及比热容沪粤版(含及详细).doc
- 大气中二氧化硫的污染状况及脱除.pptx
- 第十章南京临时政府的行政管理.ppt
- 第1章电力架空线线路检修作业指导书.doc
- 中国国家标准 GB/Z 18975.11-2026工业自动化系统与集成 流程工厂(包括石油和天然气生产设施)生命周期数据集成 第11部分: 基于RDFS方法论的参考数据工业简化用法.pdf
- GB 51251-2017 建筑防烟排烟系统技术标准 正式版加条文.pdf
- 《建筑防烟排烟系统技术标准》GB51251-2017(170822报批稿)规范.pdf
- 2025年人形机器人市场研究报告.docx
- 2025年人形机器人市场研究报告.pdf
- 从对话到执行:OpenClaw企业级智能体应用手册.pdf
- 《商业模式创新》.pdf
- Openclaw龙虾全维度安全实战指南.pdf
- 2025年IT行业项目管理调查报告.pdf
- 2025年宠物洗护市场复盘总结及新品趋势.pdf
最近下载
- 10/0.4kV变电所的设计(毕业学术论文设计).doc VIP
- 乐山3000吨多晶硅项目环评报告书.doc VIP
- [指南]一例上消化道出血的护理 个案护理.ppt VIP
- 部编人教版四年级下册道德与法治全册试卷(含答案) .pdf VIP
- 河道整治工程投标施工组织设计方案(建筑、机电、绿化).pdf VIP
- 9.2.2 用坐标表示平移(第1课时 点在坐标系中的平移)(课件)-七年级数学下(人教版2024).pptx VIP
- 会计学原理(北京交大)中国大学MOOC慕课 章节测验期中考试答案.pdf VIP
- 四川永祥多晶硅有限公司3000吨多晶硅环评报告.docx VIP
- 普及安全知识,提高避险能力主题班会ppt课件.pptx VIP
- 机器学习在反欺诈中的应用-第132篇.docx VIP
原创力文档

文档评论(0)