- 3
- 0
- 约4.6千字
- 约 5页
- 2017-07-08 发布于天津
- 举报
一文看懂大数据的技术—光环大数据培训.pdf
一文看懂大数据的技术生态圈
大数据本身是个很宽泛的概念,Hadoop 生态圈(或者泛生态圈)基本上都是
为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需
要的各种工具。锅碗瓢盆,各有各的用处,互相之间又有重合。你可以用汤锅
直接当碗吃饭喝汤,你可以用小刀或者刨子去皮。但是每个工具有自己的特
性,虽然奇怪的组合也能工作,但是未必是最佳选择。
大数据,首先你要能存的下大数据。
传统的文件系统是单机的,不能横跨不同的机器。HDFS (Hadoop Distributed
FileSystem)的设计本质上是为了大量的数据能横跨成百上千台机器,但是你
看到的是一个文件系统而不是很多文件系统。比如你说我要获取/hdfs/tmp/file1
的数据,你引用的是一个文件路径,但是实际的数据存放在很多不同的机器
上。你作为用户,不需要知道这些,就好比在单机上你不关心文件分散在什么
磁道什么扇区一样。HDFS 为你管理这些数据。
存的下数据之后,你就开始考虑怎么处理数据。
想拿高薪,选对行业很重要!学大数据开发,工资高,前景好,发展空间大!
虽然HDFS 可以为你整体管理不同机器上的数据,但是这些数据太大了。一台
机器读取成T 上P 的数据(很大的数据哦,比如整个东京热有史以来所有高清
电影的大小甚
您可能关注的文档
- 440t_h 循环流化床锅炉飞灰可燃物高原因.pdf
- 457、469及485桥的使用及保养.pdf
- 72V直流电源参数选型.docx
- A4花边纸边框.doc
- Atlas冷干机说明书.pdf
- A巍巍中山陵 2.ppt
- CAD出图校正绘图仪教程.doc
- CFBC固硫灰膨胀性改善及利用研究.pdf
- CFB锅炉耐热铸钢的生产研究.pdf
- CN02215986.A_反冲洗净水机__1-5.pdf
- 2026届甘肃省民勤三中高考化学三模试卷含解析.doc
- 2021年人力资源年终工作汇报 附2026年人力预算测算表 可直接套用.pptx
- 2021年直播间氛围打造提升停留时长培训课件.pptx
- 2026届广西钦州市第二中学高三第二次模拟考试历史试卷含解析.doc
- 2020应对儿童厌学叛逆专属心理健康教育宣讲课件.pptx
- 2026届江苏省南通巿启东中学5月高三月考物理试题.doc
- 2026年初中语文写作课件.pptx
- 2026年电子元件检测实训教程PPT.pptx
- 2026届安徽省肥东县圣泉中学高三下期末模拟联考数学试题.doc
- 广东省惠东县惠东高级中学2026届高三考前热身生物试卷含解析.doc
最近下载
- 无机化学 冉红涛-无机化学模拟题.doc VIP
- 无损检测技术资格人员考试:目视检测真题及答案(三).docx VIP
- 第15章-成品的保藏-修改 保藏学课件第三部分--各类食品保藏基本方法.ppt VIP
- (高清版)DB3309∕T 114-2024 特定地域单元生态产品价值(VEP)核算技术规范 涉海地区.pdf VIP
- 初中英语语法:宾语从句.doc VIP
- 百师联盟2026届高三3月二轮复习联考(一)数学A试卷(含答案).pdf
- 土木工程图学习题集答案扫描.doc VIP
- 医疗保障基金使用监督管理条例实施细则解读.pptx
- (高清版)DB3311∕T 279-2024 传统村落生态产品价值核算指南.pdf VIP
- 2025年盐城工业职业技术学院单招《数学》真题含答案详解(巩固).docx VIP
原创力文档

文档评论(0)