深入浅出的hive学习总结资料.pptVIP

  • 486
  • 0
  • 约9.59千字
  • 约 29页
  • 2017-05-28 发布于湖北
  • 举报
深入浅出的hive学习总结资料精要

set hive.exec.mode.local.auto=true; #hive --service hiveserver 10000 /dev/null 2/dev/null * Hive 中没有定义专门的数据格式,数据格式可以由用户指定,用户定 义数据格式需要指定三个属性:列分隔符(通常为空格、”\t”、”\x001″)、行 分隔符 (”\n”)以及读取文件数据的方法(Hive 中默认有三个文件格式 TextFile,SequenceFile 以及 RCFile)。由于在加载数据的过程中,不需要从用 用户数据格式到 Hive 定义的数据格式的转换,因此,Hive 在加载的过程中不会对数 据本身进行任何修改,而只是将数据内容复制或者移动到相应的 HDFS 目录中。而 在数据库中,不同的数据库有不同的存储引擎,定义了自己的数据格式。所有数据 都会按照一定的组织存储,因此,数据库加载数据的过程会比较耗时。 CREATE TABLE user_info_bucketed(user_id BIGINT, firstname STRING, lastname STRING) COMMENT A bucketed copy of user_info PARTITIONED BY(ds STRING) CLUSTERED BY(user_id) INTO 256 BUCKETS; s

文档评论(0)

1亿VIP精品文档

相关文档