- 29
- 0
- 约1.63万字
- 约 29页
- 2017-07-10 发布于浙江
- 举报
国科大Hadoop作业
运行环境:在 windows 10/64bit 上安装虚拟机,运行 Ubuntu Linux
14.04.2,JDK 1.7,Hadoop 2.6.0 ,HBase 0.98 等
在单机上构成伪分布式环境
目的:学习Hadoop 和HBase 的基本编程使用。
在Hadoop 框架下,采取Mapreduce 模式处理数据。
学习java 语言的基本编程使用。
运行实例①:从HDFS 中读取文件,进行中间处理,然后写入HBase
数据库。
①从HDFS 中读取文件。如图所示,
以part.tbl 表为例,可以看出,每一行是一个关系型记录,每个
列用|分开。从第0 列开始计数。
主要处理:从HDFS 中读取文件操作。
②写入HBase 数据库。
首先了解HBase 数据模型,如图所示,
key 包括row key 与column 两部分。
所有的row key 是按顺序存储的。
其中column 又有column family 前缀。而column family 是需要
事先声明的,种类有限(例如~ 10 或~ 100),column key 可以有很
多。
具体存储时,每个c
您可能关注的文档
最近下载
- 走向成熟(青春期男生性教育).ppt VIP
- 20260424 家庭如何应对地震灾害?(震重其事).pptx
- 中标通知书中标通知书.docx VIP
- 新人教版高中化学选择性必修一全册重点知识点归纳总结(复习必背).docx VIP
- IT运维服务方案信息运维服务方案.pdf VIP
- 家庭功能评定量表(FAD).docx VIP
- 老年人能力评估师——国家职业技能标准(2020年版)(精排版).pdf VIP
- 医院IT外包运维解决方案(医院信息化运维服务方案).pdf VIP
- 2025年甘肃省天水市、平凉市、金昌市、定西市、庆阳市中考地理试卷(含解析).docx
- 安全监理考试题库及答案.docx VIP
原创力文档

文档评论(0)