- 4
- 0
- 约 42页
- 2017-06-12 发布于北京
- 举报
原文地址
/165162897/blog/1257776641
Hadoop Map/Reduce教程[一]
编辑 | 删除 | 权限设置 | 更多▼
更多▲
设置置顶
推荐日志
转为私密日志
开心延年 ?? 发表于2009年11月02日 00:15 阅读(10) 评论(1) 分类: 搜索与存储 权限: 公开
今天浏览了下hadoop的 map/reduce文档,初步感觉这东西太牛逼了,听我在这里给你吹吹。
你可以这样理解,假设你有很多台烂机器(假设1000台)
1.利用hadoop他会帮你组装成一台超级计算机(集群),你的这台计算机是超多核的(很多个CPU),一个超级大的硬盘,而且容错和写入速度都很快。
2.如果你的计算任务可以拆分,那么通过map/Reduce,他可以统一指挥你的那一帮烂机器,让一堆机器帮你一起干活(并行计算),谁干什么,负责什么,他来管理,通常处理个几T的数据,只要你有机器那就小CASE。
3.hadoop要分析的数据通常都是巨大的(T级),网络I/O开销不可忽视,但分析程序通常不会很大,所以他传递的是计算方法(程序),而不是数据文件,所以每次计算在物理上都是在相近的节点上进行(同一台机器或同局域网),大大降低的IO消耗,而且计算程序如果要经常使用的话也是可以做缓存的。
4.hadoop是一个分布式的文件系统,他就像一个管家,管理你数据的存放,在
您可能关注的文档
- iPhone使用技巧之28招秘籍.doc
- iPodTouch1代完美破解2.doc
- IP地址子网掩码计算教程.doc
- IQ、EQ、AQ:会销公司中层干部战斗力特质.doc
- iSee插件制作教程3-卡片.doc
- Isthisyourpencil重难点讲解.doc
- ITS智能交通系统招标书.doc
- IT工程师毕业4年我年薪涨到30万.doc
- it的用法及句型总结.doc
- I主语人称代词.doc
- 2026年青岛市立医院医护人员招聘考试参考题库及答案解析.docx
- 护士执业资格考试专业知识2026年真题专项易错题库含解析.docx
- 2026年宁德市中医院医护人员招聘考试备考试题及答案解析.docx
- 2026年齐齐哈尔解放军203医院医护人员招聘考试备考试题及答案解析.docx
- 2026年齐齐哈尔解放军203医院医护人员招聘笔试参考题库及答案解析.docx
- 2026年青岛市皮肤病防治院医护人员招聘笔试备考试题及答案解析.docx
- 室内设计职业规划.pptx
- 2026年宁德市中医院医护人员招聘考试备考题库及答案解析.docx
- 2026年内江市第二人民医院医护人员招聘笔试备考题库及答案解析.docx
- 护士执业资格内科护理2026年高频考点相关专业知识易错题库含解析.docx
原创力文档

文档评论(0)