Doris Insert Into数据导入详解.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1.关于insertinto的导入语法总结

2.Insertinto导入

2.1.使用场景

2.2.语法

2.2.1.参数

2.2.2.导入结果

2.3.相关配置

2.3.1.FE配置

2.3.2.Session变量

2.4.导入示例

2.4.1.创建数据库与数据表

2.4.2.通过values导入数据

2.4.3.通过select导入数据

2.5.注意事项

1.关于insertinto的导入语法总结

2.Insertinto导入

InsertInto语句的使用⽅式和MySQL等数据库中InsertInto语句的使用方式类似。但在Doris中,

所有的数据写入都是一个独立的导入作业。所以这⾥将InsertInto也作为一种导入方式介绍。

2.1.使用场景

Insertinto导入命令会同步返回导入流程的运行结果。仅导入几条测试数据,验证一下Doris系统的功

能。此时适合使用INSERTINTOVALUS的语法。

用户希望将已经在Doris表中的数据进行ETL转换并导入到一个新的Doris表中,此时适合使用

INSERTINTOSELECT语法。

用户可以创建一种外部表,如MySQL外部表映射一张MySQL系统中的表。然后通过INSERTINTO

SELECT语法将外部表中的数据导入到Doris表中。

2.2.语法

2.2.1.参数

tablet_name

导⼊数据的⽬的表。可以是db_name.table_name形式

partitions

指定待导⼊的分区,必须是table_name中存在的分区,多个分区名称用逗号分隔。如果指定⽬标分区,则

label

注意:建议指定Label而不是由系统⾃动分配。如果由系统⾃动分配,但在InsertInto语句执行过程

中,因⽹络错误导致连接断开等,则⽆法得知InsertInto是否成功。而如果指定Label,则可以再次通

过Label查看任务结果

column_name

指定的⽬的列,必须是table_name中存在的列。导⼊表的⽬标列,可以以任意的顺序存在。如果没有指定

expression

需要赋值给某个列的对应表达式

default

让对应列使用默认值

query

⼀个普通查询,查询的结果会写⼊到⽬标中。查询语句⽀持任意Doris⽀持的SQL查询语法。

values

用⼾可以通过VALUES语法插⼊⼀条或者多条数据。

注意:VALUES方式仅适用于导入几条数据作为导⼊DEMO的情况,完全不适用于任何测试和生产环

境。Doris系统本身也不适合单条数据导入的场景。建议使用INSERTINTOSELECT的方式进行批量导

⼊。

2.2.2.导入结果

表:

InsertInto本⾝就是⼀个SQL命令,其返回结果会根据执行结果的不同,分为以下几种:

1、执行成功

执行结果中,参数解释:

rowsaffected

表⽰总共有多少行数据被导⼊。warnings表⽰被过滤的行数。

label

status

表⽰导⼊数据是否可⻅。如果可⻅,显⽰visible,如果不可⻅,显⽰committed。

txnId

err

字段会显⽰⼀些其他⾮预期错误。当需要查看被过滤的行时,用⼾可以使用如下语句。返回结果中的URL

可以用于查询错误的数据

2、执行失败

执行失败表示没有任何数据被成功导入,并返回如下:

其中ERROR1064(HY000):allpartitionshavenoloaddata显⽰失败。后面的url可以用于查询

错误的数据。

2.3.相关配置

2.3.1.FE配置

timeout:

超时时间是统⼀的,默认的timeout时间为1⼩时。如果导⼊的源⽂件⽆法再规定时间内完成导⼊,则需

2.3.2.Session变量

enable_insert_strict

Session参数用来控制。当该参数设置为false时,表⽰⾄少有⼀条数据被正确导⼊,则返回成功。如果

query_timeout

2.4.导入示例

2.4.1.创建数据库与数据表

PROPERTIES(replica

您可能关注的文档

文档评论(0)

136****1820 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档