- 5
- 0
- 约1.84千字
- 约 108页
- 2023-11-20 发布于湖北
- 举报
;;大数据的4个V;数据规模的指数增长;数据规模的指数增长:举例;数据规模的指数增长;商业数据规模增长;科研数据规模增长;规模很重要!;千级别(thousand)数据样本;百万级别(million)数据样本;十亿级别(billion)数据样本;万亿级别(trillion)数据样本;;我们要如何应对数据增长?;传统分布式数据管理和计算;Google三驾马车;Hadoop的创立;Hadoop的发展壮大;Hadoop系统的目标;Hadoop(及所有并行系统)思路:分而治之;Hadoop的思路:Scaling Out;Hadoop的思路:昂贵?廉价;Hadoop的思路:昂贵?廉价;Hadoop的思路:低成本服务器集群;Hadoop的思路:计算靠近数据;Hadoop技术族;;初步了解一下HDFS;什么是HDFS;一个典型的Hadoop集群;HDSF举例;节点、集群长什么样子?;节点分工;客户端(Client);名称节点(NameNode);数据节点(DataNode);案例分析:Yahoo!的HDFS实践;进一步了解HDFS系统构成;HDFS块;名称节点和数据节点更多细节;名称节点核心数???结构;FsImage文件;为什么要有EditLog?;第二名称节点:SecondaryNameNode;数据冗余和错误恢复;冗余数据保存;数据存储策略;数据错误与恢复——名称节点错;数据错误与恢复——数据节点错;数据错误与恢复——数据出错;HDFS数据读写过程;读数据的过程;写数据的过程;HDFS数据读代码;;HDFS服务启动;HDFS的Web界面;HDFS常用命令;;利用Java API访问HDFS;;面向数据密集型的离线计算;WordCount任务;并行处理WordCount;并行WordCount;从WordCount到MapReduce;从系统的角度看;从WordCount到MapReduce;MapReduce;MapReduce的优势;MapReduce作为编程模型;MapReduce作为编程模型——Map和Reduce函数;Mapper;Reducer;MapReduce编程模型;MapReduce作为并行框架:体系结构;MapReduce体系结构;MapReduce的体系结构;工作流程;概述;整体流程;作业启动;初始化——创建作业(job);作业/任务调度;Map;Shuffle;Reduce;结束;整体流程;;WordCount Mapper;public static class MyReducer extends ReducerText, IntWritable, Text, IntWritable
{
private IntWritable result = new IntWritable();
public void reduce(Text key, IterableIntWritable values, Context context) throws IOException,InterruptedException
{
int sum = 0;
for (IntWritable val : values)
{
sum += val.get();
}
result.set(sum);
context.write(key, result);
} //reduce
}/class ;Main函数;课上练习:使用MR建立倒排索引;课上练习:使用MR建立倒排索引;课上练习:使用MR建立倒排索引;课上练习:使用MR建立倒排索引;课上练习:使用MR建立倒排索引;思考1:MapReduce中如何运行循环?;思考2:Map-Reduce如何实现蒙特卡洛法求圆周率;;Spark;Spark与Hadoop的对比;Spark与Hadoop的对比;参数服务器(Parameter Server);TensorFlow;Thanks!
您可能关注的文档
- 读书分享会PPT课件.pptx
- 高级综合英语写作北京化工大学答案.docx
- 小学五年级语文上册期中试卷及答案【完整版】.doc
- 半导体物理完整版.doc
- 机械波一章习题解答.doc
- 清单11 记叙文阅读之朗读设计 表达技巧 主旨情感 开放探究(知识 方法 能力清单)(原卷版)-2026年中考语文二轮复习讲练(全国通用).docx
- 热点11 《中华人民共和国治安管理处罚法》(热点专练)(解析版)(全国通用) 2026年中考道德与法治一轮复习讲练.docx
- 专题02 常用地理计算(讲义)(全国通用)(解析版)-2026年中考地理二轮复习讲练.docx
- 小说易错02 重点情节理解偏差(选择题)(易错专练)(全国通用)(解析版)-2026年高考语文二轮复习讲练.docx
- 热点08 新质生产力与科技强国之路——从DeepSeek到锂电池技术突破(热点专练)(全国通用)(原卷版)-2026年高考历史二轮复习讲练.docx
- 散文题型03 理解分析词句(题型专练)(全国通用)(解析版)-2026年高考语文二轮复习讲练.docx
- 考前押题10 阅读理解之应用文——关注生活 学以致用(原卷版)(押题训练)2026年高考英语阅读理解突破策略及押题(全国通用).docx
- 清单04 综合性学习之语言表达(仿写邀请转述劝说) 活动策划(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 清单09 古诗文对比阅读之内容 情感 写法对比 语言 炼字 拓展探究(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 小说易错02 重点情节理解偏差(选择题)(易错专练)(全国通用)(原卷版)-2026年高考语文二轮复习讲练.docx
- 专题01 声现象(题型专练)(全国通用)(原卷版)2026年中考物理二轮复习讲练.docx
- 清单08 文言文(议论类 书信应用类)阅读之论点把握 文体特点(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 清单11 记叙文阅读之朗读设计 表达技巧 主旨情感 开放探究(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 语言清单05 语法填空中的词类(五)无提示词--连词(全国通用)(原卷版)2026年高考英语二轮复习讲练.docx
- 第04讲 想象探索与科学精神(《西游记》《海底两万里》《昆虫记》全国通用(讲义)(解析版)2026年中考语文一轮复习讲练.docx
最近下载
- 2025云南农业大学后勤服务有限公司招聘32人备考题库带答案解析.docx VIP
- 松材线虫课件.pptx VIP
- 2023年洁净车间生产环境控制教材方案模板.pptx VIP
- 【PPT】品管圈(QCC)降低科室一次性耗材浪费率 .pptx
- 2026高中数学复习-专题19 立体几何初步(Ⅱ)(七大题型+模拟精练)(解析版).pdf VIP
- 2025年教师职称-山西-山西教师职称(基础知识、综合素质、小学体育)历年参考题典型考点含答案解析.docx VIP
- isilon Drive Support Package 驱动支持包 1.37 发布说明(英文).pdf VIP
- 企业消防安全知识培训.pptx
- 山东省阳谷县第二中学高中音乐:古老的声音教案.doc VIP
- 常用建筑材料图例整理.doc VIP
原创力文档

文档评论(0)