写好Hive 程序的五个提示.pdfVIP

  • 0
  • 0
  • 约4.97千字
  • 约 5页
  • 2022-02-23 发布于江苏
  • 举报
使用Hive 可以高效而又快速地编写复杂的MapReduce 查询逻辑。但是某些情况下,因为不 熟悉数据特性,或没有遵循Hive 的优化约定,Hive 计算任务会变得非常低效,甚至无法得 到结果。一个”好”的Hive 程序仍然需要对Hive 运行机制有深入的了解。 有一些大家比较熟悉的优化约定包括:Join 中需要将大表写在靠右的位置;尽量使用UDF 而不是transfrom ……诸如此类。下面讨论5 个性能和逻辑相关的问题,帮助你写出更好的 Hive 程序。 全排序 Hive 的排序关键字是SORT BY,它有意区别于传统数据库的ORDER BY 也是为了强调两者 的区别

文档评论(0)

1亿VIP精品文档

相关文档