- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
7Loader数据导入导出实战
7.1实验背景
大数据业务中经常涉及数据迁移操作,尤其是关系型数据库与大数据组件间的数
据迁移操作,比如,实现MySql与HDFS/HBase间的数据迁移。Loader基于开源
Sqoop组件1.99.x版本进行了功能增强。它的图形化操作使得数据迁移更加方便
易行。
图:Loader在FusionInsight产品中的位置
7.1.1组件原理
通过MapReduce实现并行执行和容错
Loader通过MapReduce作业实现并行的导入或者导出作业任务,不同类型的导入导
出作业可能只包含Map阶段或者同时Map和Reduce阶段。
Loader同时利用MapReduce实现容错,在作业任务执行失败时,可以重新调度。
数据导入到HBase
1.在MapReduce作业的Map阶段中从外部数据源抽取数据。
2.在MapReduce作业的Reduce阶段中,按Region的个数启动同样个数的Reduce
Task,ReduceTask从Map接收数据,然后按Region生成HFile,存放在HDFS
临时目录中。
3.在MapReduce作业的提交阶段,将HFile从临时目录迁移到HBase目录中。
数据导入HDFS
1.在MapReduce作业的Map阶段中从外部数据源抽取数据,并将数据输出到HDFS
临时目录下(以“输出目录-ldtmp”命名)。
2.在MapReduce作业的提交阶段,将文件从临时目录迁移到输出目录中。
数据导出到关系型数据库
1.在MapReduce作业的Map阶段,从HDFS或者HBase中抽取数据,然后将数据
通过JDBC接口插入到临时表(StagingTable)中。
2.在MapReduce作业的提交阶段,将数据从临时表迁移到正式表中。
数据导出到文件系统
1.在MapReduce作业的Map阶段,从HDFS或者HBase中抽取数据,然后将数据
写入到文件服务器临时目录中。
2.在MapReduce作业的提交阶段,将文件从临时目录迁移到正式目录中。
7.2实验目的
掌握Loader的使用,能够在业务场景中实现数据迁移操作。
7.3实验前提
实验环境创建成功后,请等待1-2分钟,后台在执行start-oms.sh脚本:
1.执行sh${BIGDATA_HOME}/om-server/om/sbin/status-oms.sh命令查看
OMS的状态,显示信息表示主备OMS服务启动正常再执行下一步。
2.在windows-client打开GoogleChrome浏览器登录FusionInsightManager
地址(00:8080/web)。
3.用户名admin,密码Huawei!@34(如原密码过期,则自行修改密码)
4.登录FusionInsightManager后,单击“服务管理”,选择“更多操作启动集
群”。
5.在弹出的提示框中单击“确定”,开始启动集群。界面提示“操作成功。”,单击“完
成”,集群成功启动。
6.使用SecureCRT工具登录到fihsots-1节点上,接下来进行环境变量设置与
用户认证。
cd/opt/hadoopclient/切换到客户端安装目录。
sourcebigdata_env配置环境变量。
kinituser01进行用户
您可能关注的文档
- 大数据技术基础及应用实验手册1.安装FusionInsightHD.pdf
- 大数据技术基础及应用实验手册2.集群管理.pdf
- 大数据技术基础及应用实验手册3.FusionInsight客户端安装.pdf
- 大数据技术基础及应用实验手册4.HDFS文件系统实战.pdf
- 大数据技术基础及应用实验手册5.HBase数据库实战.pdf
- 大数据技术基础及应用实验手册5.MapReduce实验.pdf
- 大数据技术基础及应用实验手册6.Hive数据仓库实战.pdf
- 大数据技术基础及应用实验手册8.Kafka消息订阅实战.pdf
- 大数据技术基础及应用实验手册9.Flume数据采集实战.pdf
- 大数据技术基础及应用实验手册10.Solr全文检索服务实战.pdf
最近下载
- 内蒙古开放大学《个案工作》在线学习评价页面作业(1).docx VIP
- 话题作文“窗”写作导引.doc VIP
- 2021一级建造师考试《建筑工程管理与实务》考点清单.docx VIP
- 《轻钢结构集成活动房屋设计》【毕业设计论文】.doc VIP
- 高质量数据集建设实施路径(34页 PPT).pptx VIP
- 抗菌药物管理及合理使用完整版PPT.pptx VIP
- 供水管网铺设施工方案.docx VIP
- 2025年美容师(初级)美容院卫生标准理论知识考核试卷.docx VIP
- 环保教育融入小学语文教学的策略研究教学研究课题报告.docx
- 2025年陕西延长石油(集团)有限责任公司招聘笔试参考题库含答案解析.docx VIP
原创力文档


文档评论(0)