Hadoop大数据平台基础与应用 目录 大数据背景 Hadoop简介 Hadoop核心之HDFS Hadoop核心之MapReduce Hadoop应用案例 研究设想(结合案例推理系统) 大数据的特性 Volume Volume Variety Volume 模态多样 Veracity Volume 真伪难辨 Velocity Volume 速度极快 体量巨大 文本 视频 图片 音频 到2020年,数据总量达40ZB,人均5.2TB 分享的内容条目超过25亿个/天,增加数据超过500TB/天 大数据涉及的领域 * 用户生成数据 Deep Web数据 多模态内容数据 天文 气象 基因 医学 经济 物理 其他领域 网络与关系数据 大数据史记 一种大数据可视化系统架构 Hadoop是什么? Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。 解决的问题: 海量数据的存储——HDFS 海量数据的分析——MapReduce 资源管理调度——Yarn(hadoop2.X之后) Hadoop的产生 根据Google发布的三篇论文——GFS(The Google File System)、MapReduce、BigTable Hadoop项目结构 除了Hadoop的两大核心内容Hadoop分布式文件系统(HDFS)和MapReduce计算框架之外,还有着其他紧密的关联
您可能关注的文档
- H7N9诊疗方案报告范本.ppt
- H7N9最新诊疗方案报告范本.ppt
- Chapter3-随机信号表示法报告范本.ppt
- HAART南宁报告范本.ppt
- HACH氨氮仪报告范本.ppt
- Hadoop集群监控与Hive高可用-暴风影音报告范本.ppt
- haoRNA转录报告范本.ppt
- chapter4分子发光-荧光与磷光报告范本.ppt
- Chapter4固体废物监测报告范本.ppt
- 北京华远尚都国际中心景观设计方案汇报(67页)绪论.ppt
- 2026住宅小区消防改造建筑方案(执行版,含总平面布置/疏散流线/消防节点).docx
- 2026制造工厂人力资源规划与排班配置方案(执行版,含排班模型/岗位编制/缺口清单).docx
- 2026人工智能企业内训实施计划(执行版,含培训安排/案例任务/考核清单).docx
- 2026仓储物流园总平面布置建筑方案(执行版,含车流组织/仓位分区/消防间距).docx
- 2026老旧办公楼节能改造建筑方案(执行版,含围护结构/节能设备/施工节点).docx
- 2026Python文件批量重命名与归档脚本方案(执行版,含文件样例/处理脚本/归档规则).docx
- 2026企业会计准则长期股权投资核算指南(执行版,含成本法分录/权益法分录/减值检查表).docx
- 2026社区养老服务中心项目可行性研究报告(执行版,含服务需求/建设内容/运营预算).docx
- 2026物流园冷链仓储项目可行性研究报告(执行版,含选址分析/设备配置/财务测算).docx
- 2026企业会计准则现金流量表编制口径手册(执行版,含分类口径/填报模板/勾稽检查表).docx
原创力文档

文档评论(0)