- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
星环信息科技(上海)有限公司
TDH 数据平台认证工程师试题
姓名: _______________ 分数: ____________
【 说明】
a)
客观题
30 题,每题
2 分,总计
60
分
b)
主观题
4 题,每题
10 分,总计
40
分
满分 100 分。
【不定项选择题(每题
2 分共
60 分)】
1 、下列与
HDFS
有关的说法正确的是(
)
A. HDFS DataNode
节点上的磁盘需要做
RAID1
,用来保证数据的可靠性
B. HDFS
可以在磁盘之间通过
balance
操作,平衡磁盘之间的负载情况
C. HDFS
建议
DataNode
之间的数据盘个数、容量大小不一致,以体现
HDFS
的负载
均衡能力
D.规划
HDFS
集群时,建议
Active
NameNode
和
Standby
NameNode
分配在不同的
机架上
2 、以下哪个服务作为
HDFS
高可靠协调服务的共享存储?(
)
ZooKeeper
JournalNodes
NameNode
ZKFailoverController
3 、在集群中配置
HDFS
的副本数为
3,设置数据块大小为
128M
,此时我们上传一份
64M
的数据文件,该数据文件占用
HDFS
空间大小为(
)
A.64M
B . 128M
C . 384M
D . 192M
4 、在 Yarn 服务中,不包含以下哪种角色(
A . ResourceManager
B . NodeManager
C . ApplicationMaster
D . Contianer
)
5 、 ResourceManager
是
的主要组成部分,有关其功能描述不正确的是(
)
A .
它直接将集群所拥有的资源按需分配给运行在
YARN
上的应用程序
B . 它负责将集群中的所有资源进行统一管理和分配
C . 它接受各个节点的资源汇报信息
D . 它把资源按照策略分配给各应用
星环信息科技(上海)有限公司
6、当前用户提交了一个
wordcount
词频统计的任务,
最后任务执行失败,
可能的原因有
哪些( )
A .
当前集群中没有足够的资源,不足以满足当前
wordcount
任务的需求
B .
C .
执行该任务的用户没有权限访问
用户在执行任务之前在 HDFS
HDFS 上的数据文件
相应的目录下创建了提交任务时指定的输出目录
D .
以上原因都有可能
7、以下关于外表和托管表描述正确的是( )
A、外表的数据存储在本地,托管表的数据存储在 hdfs 上
B、删除托管表只会删除 Inceptor 上的元数据不会删除数据文件,
删除外表两者都会
被删除
C、删除外表只会删除
Inceptor
上的元数据不会删除数据文件,
删除托管表两者都会
被删除
D、删除托管表或外表,
incepotr
上的元数据和数据文件都会被删除
8、 SQL 运行中如果出现 maptask 数据特别多,执行时间又很短时可以通过小文件合并来
进行优化,以下是合并参数有( )
SET ngmr.partition.automerge = TRUE;
SET ngmr.partition.mergesize = n;
SET ngmr.partition.mergesize.mb = m;
SET mapred.reduce.tasks = N;
9、以下关于 inceptor 日志信息描述正确的有( )
A. Inceptor server 日志存放于各节点的 /var/log/inceptorsql[x]/hive-server.log
B. 可以通过 inceptor server 4040 查看 SQL 错误日志
Excutor 日志存放于 excutor 节点的 /var/log/inceptorsql[x]/spark-excutor.log
D. ExcutorGC 日志存放于 excutor 节点的 /var/log/inceptorsql[x]/spark-excutor.gc.log
10、 tableA 有 10G 的数据, tableB 有 100G 的数据,两个表通过共有的 id 列做关联查询
name 列,以下方式可以优化计算效率的是( )
select /*+MAPJOIN(a)*/ a.name,b.name from tableA a join tableB b on a.id=b.id
se
您可能关注的文档
最近下载
- 塔的水力学计算手册.doc VIP
- 2025年警法考试-广西公安特殊人才-广西公安机关(法医)历年参考题典型考点含答案解析.docx VIP
- 2025年社区专职工作者招聘考试(公共基础知识+社区实务)题库.docx VIP
- 儿童口腔保健及不良习惯对颜面发育影响.pptx VIP
- 华东交通大学2015-2016第一学期《复变函数》期末A卷及答案.doc VIP
- (正式版)D-L∕T 5533-2017 电力工程测量精度标准.docx VIP
- 水文资料整编规范.pdf VIP
- 直播投流代投放协议.doc VIP
- CJJT71-2011 机动车清洗站技术规范.docx VIP
- 邮政集团无领导面试真题和答案.pdf
原创力文档


文档评论(0)