- 12
- 0
- 约8.15千字
- 约 6页
- 2021-07-11 发布于上海
- 举报
一、填空题(将正确的答案写入答题纸中。每空 1 分,共 20 分)
1 、HDFS 有 _ NameNode__ _ ,_ DataNode__ _ 和_ SecondaryNameNode__ _ 组成;
2、Hadoop 集群可以运行在 _ 单机模式 __ _ ,_ 伪分布式模式 __ _ 和_ 完全分布式
模式 __ _ 3 个模式?
3、安装完全分布式 Apache Hadoop 的核心配置文件有 _ core-site.xml__ _ , _ hdfs-
site.xml__ _ , _ mapred-site.xml__ _ , _ yarn-site.xml__ _ 。
4、HBase 中通过 _ HDFS__ _ 存储底层数据 ,通过 _ _Zookeeper_ _ 提供消息通信机制
5、HIVE 默认采用 _ _ Derby _ __ __ _ 数据库进行元数据的存储,而真实的数据是存储在
_ __HDFS __ __ _ 中。
6、如何在浏览器中查看 HDFS 运行状况的默认端口号是 _ 50070__ _ 查看 yarn 运行状态的
默认端口号是 _ 8088__ _
7、HDFS 中当前 block 大小为 128M, 如果当前要上传到 HDFS 中的文件大小为 300M ,那
么在存储时会分配 _ 3__ _ 个 block 进行存储。
8、HDFS 获取根目录下的文件列表的命令 shell 命令是 _hadoop fs -ls -R / __ __ __ __
__ _ ;根目录下创建 hdfs 文件夹的 shell 命令是 _ _ hadoop fs -mkdir /hdfs__ __ __ __
_ 。
9、YARN 架构中整个集群同一时间提供服务的 ResourceManager 有_ 1__ _ 个,负责集群资
源的统一管理和调度。
二、选择题(将正确的答案写入答题纸中。每题 2 分,共 20 分)
1、配置 Hadoop 时, JAVA_HOME 包含在哪一个配置文件中 (B)
A . hadoop-default.xml
B . hadoop-env.sh
C . hadoop-site.xml
D . configuration.xs
2、下面哪个程序负责 HDFS 数据存储。 (C )
A)NameNode
B)Jobtracker
C)Datanode
D)secondaryNameNode
3、下列关于 Hadoop API 的说法错误的是( A )
A . Hadoop 的文件 API 不是通用的,只用于 HDFS 文件系统
B . Configuration 类的默认实例化方法是以 HDFS 系统的资源配置为基础的
C . FileStatus 对象存储文件和目录的元数据
D . FSDataInputStream 是 java.io.DataInputStream 的子类
4、HDfS 中的 block 默认保存几份 ? (A )
A)3 份
B)2 份
C)1 份
D)不确定
5、为销售报表展示开发一个 MapReduce 作业,Mapper 输入数据的 Key 是年份 (IntWritable ),
Value 表示商品标识( Text )。下列哪一项决定该 Mapper 的数据类型?( D )
A. JobConf.setMapInputKeyClass 与 JobConf.setMapInputValuesClass
B. HADOOP_MAP_DA TATYPES 环境变量
C. 随作业一起提交的 mapper-specification.xml 文件
D. InputFormat 格式类
6、HDFS 无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括
(D )
A. 利
您可能关注的文档
最近下载
- 公共营养师考试二级练习题及答案.docx VIP
- 2023注册消防工程师(消防安全技术实务)题库含答案【基础题】.docx
- 初三化学酸碱盐知识点精讲笔记.pdf VIP
- 处方前置审核系统在合理用药管理中的应用.pptx
- 2024年浙江省中考科学试题卷(含答案解析).docx
- 中级注册安全工程师考试题库精编.docx
- 2026年郴州职业技术学院高职单招职业适应性测试模拟试题及答案解析.docx VIP
- 基于杜邦分析法的BA公司盈利能力分析.doc VIP
- (整理版)浙江省绍兴县杨汛桥镇中学九年级数学上册练习8(无答案)浙教.pdf
- 2026年山东省中考数学一轮知识点梳理复习 第一章 第二节 二次根式 课件.pptx VIP
原创力文档

文档评论(0)