- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Sqoop介绍
1.掌握Sqoop是什么2.掌握Sqoop架构介绍
1. Sqoop是什么2. Sqoop架构介绍
Sqoop是什么Sqoop是一款开源的工具,用来将Hadoop和关系型数据库中的数据相互转移,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。对于某些NoSQL数据库它也提供了连接器。Sqoop是一个ETL工具,使用元数据模型来判断数据类型并在数据从数据源转移到Hadoop时确保类型安全的数据处理。Sqoop专为大数据批量传输设计,能够分割数据集并创建Hadoop任务来处理每个区块。
Sqoop架构介绍(一)双向多进程并行
Sqoop架构介绍(二)
Sqoop架构介绍(二)sqoop的功能就是将RDBMS中的数据导入HDFS,或者将HDFS中的数据导出到RDBMS。对于文件系统中的数据导入HDFS,可以使用Flume(实时抽取)。sqoop以Hadoop 为主体,RDBMS为客体,使用sqoop的主要功能
Sqoop架构介绍(二)sqoop import将RDBMS数据放入hadoop 中,就是导入,importsqoop export将hadoo中的数据放入到RDBMs中,就是导出,export
1.什么是Sqoop -- 大数据批量迁移的ETL工具2. Sqoop架构及使用
文档评论(0)