- 0
- 0
- 约4.97千字
- 约 5页
- 2022-02-23 发布于江苏
- 举报
使用Hive 可以高效而又快速地编写复杂的MapReduce 查询逻辑。但是某些情况下,因为不
熟悉数据特性,或没有遵循Hive 的优化约定,Hive 计算任务会变得非常低效,甚至无法得
到结果。一个”好”的Hive 程序仍然需要对Hive 运行机制有深入的了解。
有一些大家比较熟悉的优化约定包括:Join 中需要将大表写在靠右的位置;尽量使用UDF
而不是transfrom ……诸如此类。下面讨论5 个性能和逻辑相关的问题,帮助你写出更好的
Hive 程序。
全排序
Hive 的排序关键字是SORT BY,它有意区别于传统数据库的ORDER BY 也是为了强调两者
的区别
原创力文档

文档评论(0)