TPCDS SQL性能分析与优化规则探讨.pdfVIP

  • 1
  • 0
  • 约2.55千字
  • 约 2页
  • 2026-06-08 发布于北京
  • 举报

题目一:分析一条TPCDSSQL(请基于Spark3.1.1版本解答)

从SQL中任意选择一条:

(1)运行该

SQL,如q38,并截图该SQL的SQL执行图(2)该SQL用到了哪些优化规则(optimizerru)(3)请

各用不少于200字描述其中的两条优化规则帮助文档:如何运行该SQL:1.从GitHubTPCDS数

据gitclone‑tpcds‑datagen.gitcd

spark‑tpcds‑datagen2.Spark3.1.1到spark‑tpcds‑datagen目录并解压wget

‑3.1.1/spark‑3.1.1‑bin‑hadoop2.7.tgztar‑zxvf

spark‑3.1.1‑bin‑hadoop2.7.tgz3.生成数据mkdir‑ptpcds‑data‑1gexportSPARK_HOME=./

spark‑3.1.1‑bin‑hadoop2.7./bin/dsdgen‑‑output‑l

文档评论(0)

1亿VIP精品文档

相关文档