- 2
- 0
- 约4.6千字
- 约 30页
- 2017-08-20 发布于天津
- 举报
Hadoop与数据分析
* * * * * * * * * * * * * * * * * * * * * * Hadoop与数据分析 淘宝数据平台及产品部基础研发组 周敏 日期:2010-05-26 Outline Hadoop基本概念 Hadoop的应用范围 Hadoop底层实现原理 Hive与数据分析 Hadoop集群管理 典型的Hadoop离线分析系统架构 常见问题及解决方案 关于打扑克的哲学 打扑克与MapReduce Input split shuffle output 分牌 各自齐牌 交换 再次理牌 搞定 统计单词数 The weather is good This guy is a good man Today is good Good man is good the 1 weather 1 is 1 good 1 today 1 is 1 good 1 this 1 guy 1 is 1 a 1 good 1 man 1 good 1 man 1 is 1 good 1 a 1 good 1 good 1 good 1 good 1 good 1 man 1 man 1 the 1 weather 1 today 1 guy 1 is 1 is 1 is 1 is 1 this 1 a 1 good 5 guy 1 is 4 man 2 the 1 this 1 today 1 weather 1 流量计算 * 趋势分析 * /截图 用户推荐 * 分布式索引 * * Hadoop 核心 Hadoop Common 分布式文件系统HDFS MapReduce框架 并行数据分析语言Pig 列存储NoSQL数据库 Hbase 分布式协调器Zookeeper 数据仓库Hive(使用SQL) Hadoop日志分析工具Chukwa Hadoop生态系统 * Data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Data data data data data Results Data data data data Data data data data Data data data data Data data data data Data data data data Data data data data Data data data data Data data data data Data data data data Hadoop Cluster DFS Block 1 DFS Block 1 DFS Block 2 DFS Block 2 DFS Block 2 DFS Block 1 DFS Block 3 DFS Block 3 DFS Block 3 MAP MAP MAP Reduce Hadoop实现 作业执行流程 // MapClass1中的map方法 public void map(LongWritable Key, Text value, OutputCollectorText, Text output, Reporter reporter) throws IOException { String strLine = value.toString(); String[] strList = strLine.split(\); String mid = strList[3]; String sid = strList[4]; String timestr = strList[0]; try{ timestr = timestr.substring(0,10); }catch(Exception e){return;} timestr += 0000; // 省略数十行 output.collect(new Text(mid + “\”” + “sid\”” + timestr , ...); } Hadoop案例(1) public static cl
您可能关注的文档
- 2003年我院申请和授权的专利-四川农业科学院.DOC
- 2011年FESTO气动技术培训班招生-FestoDidactic.PDF
- 2011年年报及2012年定报工业财务及物流布置会讲稿-门头沟区统计局.PPT
- 2011年河北环境状况公报-河北环保厅.DOC
- 2010年高考题:D.PPT
- 2011年院感知识手册20101民大医院.DOC
- 2011年职工书屋.PPT
- 2012年下学期高二年级文科化学段考试题-石门第一中学.DOC
- 2012年上海国家职业资格鉴定申报条件-上海人力资源和.DOC
- 2013—2014学年五四红旗分团委五四红旗团支部.DOC
- 伟明环保-市场前景及投资研究报告-境内业务稳健运行,印尼市场贡献边际增量.pdf
- 桂东县法院系统招聘考试真题2025.pdf
- 贵州省黔南布依族2026年中考三模物理试题及答案.pdf
- 贵州省黔南州2026年中考语文二模试卷附答案.pdf
- 贵州省铜仁市2026年中考语文二模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套完整答案详解.docx
- 贵州省毕节市2026年中考语文一模试卷附答案.pdf
- 贵州省贵阳市南明区2026年中考语文一模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套参考答案详解.docx
- 贵州省贵阳市白云区2026年中考二模物理试题附答案.pdf
原创力文档

文档评论(0)