数据工程师培训题库(四).pdfVIP

  • 46
  • 0
  • 约1.13万字
  • 约 10页
  • 2020-09-07 发布于天津
  • 举报
. 6 、当前用户提交了一个 wordcount 词频统计的任务, 最后任务执行失败, 可能的原因有 哪些( ) TDH 数据平台认证工程师试题 姓名: _______________ 分数: ____________ A . 当前集群中没有足够的资源,不足以满足当前 wordcount 任务的需求 【说明】 B . 执行该任务的用户没有权限访问 HDFS上的数据文件 a) 客观题 30 题,每题 2 分,总计 60 分 C . 用户在执行任务之前在 HDFS相应的目录下创建了提交任务时指定的输出目录 b) 主观题 4 题,每题 10 分,总计 40 分 D . 以上原因都有可能 c) 满分 100 分。 7 、以下关于外表和托管表描述正确的是( ) 【不定项选择题(每题 2 分共 60 分)】 A 、外表的数据存储在本地,托管表的数据存储在 hdfs 上 1、下列与 HDFS有关的说法正确的是( ) B、删除托管表只会删除 Inceptor 上的元数据不会删除数据文件, 删除外表两者都会 A .HDFS DataNode节点上的磁盘需要做 RAID1,用来保证数据的可靠性 被删除 B.HDFS可以在磁盘之间通过 balance 操作,平衡磁盘之间的负载情况 C、删除外表只会删除 Inceptor 上的元数据不会删除数据文件, 删除托管表两者都会 C.HDFS建议 DataNode 之间的数据盘个数、容量大小不一致,以体现 HDFS的负载 被删除 均衡能力 D、删除托管表或外表, incepotr 上的元数据和数据文件都会被删除 D.规划 HDFS集群时,建议 Active NameNode 和 Standby NameNode 分配在不同的 机架上 8 、SQL运行中如果出现 maptask 数据特别多,执行时间又很短时可以通过小文件合并来 2 、以下哪个服务作为 HDFS高可靠协调服务的共享存储?( ) 进行优化,以下是合并参数有( ) A. ZooKeeper A. SET ngmr.partition.automerge = TRUE; B. JournalNodes B. SET ngmr.partition.mergesize = n; C. NameNode C. SET ngmr.partition.mergesize.mb = m; D. ZKFailoverController D. SET mapred.reduce.tasks = N; 3 、在集群中配置 HDFS的副本数为 3,设置数据块大小为 128M ,此时我们上传一份 64M 9 、以下关于 inceptor 日志信息描述正确的有( ) 的数据文件,该数据文件占用 HDFS空间大小为( ) A. Inceptor server 日志存放于各节点的 /var/log/inceptorsql[x]/hive-server.log A . 64M B. 可以通过

文档评论(0)

1亿VIP精品文档

相关文档