- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
sqoop的导出
1、了解sqoop导出数据的原理
目录sqoop的导出原理01
sqoop的导出原理1
sqoop的导出原理
sqoop的导出原理连接数据库的常用参数:参数描述--connect jdbc-urijdbc 连接地址--connection-manager class-name连接管理类--driver class-name数据库驱动类--hadoop-mapred-home dir$HADOOP_MAPRED_HOME--helphelp 信息--password-file为包含身份验证密码的文件设置路径-P从命令行输入密码--password password密码--username username用户名--verbose打印流程信息--connection-param-file filename可选参数--relaxed-isolation将连接事务隔离设置为读取未提交的映射程序
sqoop的导出原理常用参数说明:参数描述--columns col,col,col…Columns to export to table--direct快速模式,利用了数据库的导入工具,如mysql的mysqlimport,可以比jdbc连接的方式更为高效的将数据导入到关系数据库中。--export-dir dir存放数据的HDFS的源目录-m,--num-mappers n启动N个map来并行导入数据,默认是4个,最好不要将数字设置为高于集群的最大Map数--table table-name要导入到的关系数据库表--call stored-proc-name要调用的存储过程--update-key col-name后面接条件列名,通过该参数,可以将关系数据库中已经存在的数据进行更新操作,类似于关系数据库中的update操作--update-mode mode更新模式,有两个值updateonly和默认的allowinsert,该参数只能是在关系数据表里不存在要导入的记录时才能使用,比如要导入的hdfs中有一条id=1的记录,如果在表里已经有一条记录id=2,那么更新会失败。--batch使用批处理模式执行底层语句。
sqoop的导出原理sqoop的插入和更新:默认情况下,sqoop-export向表追加新行;将每个输入记录转换为INSERT语句,该语句向目标数据库表添加一行。如果表有约束(例如,主键列的值必须是唯一的),并且已经包含数据,则必须小心避免插入违反这些约束的记录。如果INSERT语句失败,导出过程将失败。这种模式主要是针对导出记录到一个新表或空表。如果指定--update-key参数,Sqoop将修改数据库中的现有数据集。每个输入记录都被视为更新语句,修改一个现有的行。
sqoop的导出原理输入解析参数:参数描述--input-enclosed-by char设置一个必用的字段关闭符--input-escaped-by char设置输入转义符--input-fields-terminated-by char设置输入字段分隔符--input-lines-terminated-by char设置输入的 行结束符--input-optionally-enclosed-by char设置一个可选的闭合符
sqoop的导出原理输出解析参数:参数说明设置一个必用的字段闭合符--escaped-by char设置转义符--fields-terminated-by char设置字段分隔符--lines-terminated-by char设置行结束符--mysql-delimiters使用mysql默认的一组分割符设置: 字段:, 分割符:/ 可选闭合符:--optionally-enclosed-by char设置一个字段闭合符(该闭合符只有字段内出现分割符字符时才会用于字段。)
1、sqoop导出数据的原理
您可能关注的文档
- SQL查询分析查询客户购买时段情况.pptx
- SQL查询分析查询老客户情况.pptx
- 二零二三年 优质公开课SQL的漏洞.pptx
- 二零二三年 优质公开课SQL语句建表.pptx
- 二零二三年 优质公开课Sqoop.pptx
- Sqoop介绍“十市联赛”一等奖.pptx
- Sqoop修改配置文件.pptx
- Sqoop修改配置文件(区一等奖).pptx
- 二零二三年 优质公开课Sqoop安装与配置.pptx
- 二零二三年 优质公开课sqoop安装使用.pptx
- 江苏开放大学2024秋《会计信息系统应用》第2次过程性考核作业参考答案.pdf
- 24秋国开《中国法律史》平时作业2答案.docx
- 国家开放大学本科《古代小说戏曲专题》形考任务4试题及答案.pdf
- 24秋国开《中国法律史》平时作业1-3答案.doc
- 120个文言文实词.doc
- 国家开放大学本科《古代小说戏曲专题》形考任务2试题及答案.pdf
- 2024年广西普法考试答案(第15套).pdf
- 国家开放大学本科《古代小说戏曲专题》形考任务2试题及答案.doc
- 江苏开放大学2024秋《会计信息系统应用》第2次过程性考核作业参考答案.docx
- 国家开放大学本科《古代小说戏曲专题》形考任务4试题及答案.docx
文档评论(0)