COPY 使用.docxVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
COPY 使用

+69该命令是COPY最简单的使用格式,在指定文件时用绝对路径COPYEquipment_Dimension from/opt/vertica/examples/Telecom_Schema/Equipment_Dimension.tbl DELIMITER |这个例子主要用来测试对Source中的数据做Data TransformationSource文件:2009/06/171979/06/302007/11/26表T结构:YearMonthDayK使用命令:COPY t(Year AS TO_CHAR (k, YYYY), Month AS TO_CHAR (k, Month), DayAS TO_CHAR (k, DD), K FORMAT YYYY/MM/DD) FROM ‘/opt/vertica/examples/Telecom_Schema/Test/datetest’;据我自己测试下来,文件中的一列记录在COPY命令解析时将COPY中没有使用转换函数的列(Parsed column)按照顺序与源文件中数据对应.COPY t(year ASYR,month AS TO_CHAR(k, Month),day AS TO_CHAR(k, DD),YR FILLER VARCHAR(10),k FORMAT YYYY-MM-DD) FROM /opt/vertica/examples/Telecom_Schema/Test/datetest DELIMITER|;COPY t from/opt/vertica/examples/Telecom_Schema/Test/datetest;Source文件:2009/06/17|091979/06/30|792007/11/26|07COPY t(Year AS YR,Month AS TO_CHAR (k, Month),Day AS TO_CHAR (k, DD),YR FILLER VARCHAR (10),K FORMAT YYYY-MM-DD) FROM /opt/vertica/examples/Telecom_Schema/Test/datetest DELIMITER |’;按照“|”为分隔符,分为两个Parsed Column,并且进行出来,同时设置一个Parse Column为FILLER,FILLER必须要制定数据类型ESCAPE AS选项应用主要是用来指定记录中可以忽略的字符,默认是\,如果是ab\cd,Load到表中是abcd,如果是ab\\cd,ab\\\cd,ab\\\\cd,只要中间大于或等于2次,统一会转化成一个\如果希望input文件中的\在load到数据库中的时候,被识别为\,而不被忽略时,可以用该选项指定ESCAPE的字符为别的字符Stream Name选项应用用来为一个Stream 设定一个name,这样在LOAD_STREAM表中可以直接找到对应的StreamAUTO | DIRECT | TRICKLE AUTO: 将数据Load进WOS,知道WOS满了,则会把数据直接Load进ROSDIRECT:直接将数据绕过WOS,Load到ROS中,比较适合大数据量Load,如果小数据量多次Load进ROS的话,会在磁盘上生成多个ROS,以后还是要进行合并.TRICKLE:只会写ROS,如果空间满了,会报错并且对数据ROLL BACK。比较适合对Patition Table做数据加载ABORT ON ERROR选项应用如果有ROW被reject或者Roll back,则停止COPY命令,没有数据加载进来ENFORCELENGTH选项应用如果对于某一个源数据‘abc’,目标表中该字段的长度不够3个字符,如果没有这个选项,则会自动truncate变成‘ab’,如果加入这个字符,便会报错REJECTED DATA选项应用指定Reject row所存放的file的路径EXCEPTIONS选项应用指定写入信息,包括输入数据的行数,reject row产生的原因等所在文件的位置。REJECTMAX选项应用指定rejected row的数量达到上限,算Load失败,如果失败,那么失败的记录均会写入Reject 文件SKIP选项应用忽略每个文件中,前n个数据的加载,可以省略一些头信息RECORD TERMINATOR选项应用指定每条记录的结束符,如果不去指定每一行的结束符,Unix上面linefeed(E’\N’换行),window上是carriage(E’\r\n’)回车,如果在Copy命令中指定了这个选项,要确保有这个结束符在源文件中。这个选项的符号不能与DELIMITER,NULL,ESCAPE, ENCLOSED BY冲突TRAILING

文档评论(0)

xxj1658888 + 关注
实名认证
文档贡献者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2024年04月12日上传了教师资格证

1亿VIP精品文档

相关文档