- 2
- 0
- 约5.62千字
- 约 6页
- 2023-10-24 发布于上海
- 举报
一、填空题(将正确的答案写入答题纸中。每空1 分,共 20 分)
1、HDFS 有 _ NameNode _,_ DataNode _和_ SecondaryNameNode _组成;
2、
2、Hadoop 集群可以运行在_ 单机模式 _,_ 伪分布式模式 _和_ 完全分布式
模式 _3 个模式?
3、安装完全分布式Apache Hadoop 的核心配置文件有_ core-site.xml _,_ hdfs- site.xml _,_ mapred-site.xml _,_ yarn-site.xml _。
4、HBase 中通过_ HDFS _存储底层数据,通过_ _Zookeeper_ _提供消息通信机制
5、HIVE 默认采用_ _ Derby 数据库进行元数据的存储,而真实的数据是存储在
_ HDFS 中。
6、如何在浏览器中查看 HDFS 运行状况的默认端口号是_ 50070 查看 yarn 运行状态的
默认端口号是_ 8088 _
7、HDFS 中当前 block 大小为 128M,如果当前要上传到 HDFS 中的文件大小为 300M,那
么在存储时会分配
么在存储时会分配_ 3 _个
block 进行存储。
8、HDFS 获取根目录下的文件列表的命令shell 命令是_hadoop fs -ls -R /
_;根目录下创建hdfs 文件夹的 shell 命令是_ _ hadoop fs -mkdir /hdfs
_ 。
9、YARN 架构中整个集群同一时间提供服务的ResourceManager 有_ 1 _个,负责集群资源的统一管理和调度。
二、选择题(将正确的答案写入答题纸中。每题2 分,共 20 分)
1、配置 Hadoop 时,JAVA_HOME 包含在哪一个配置文件中(B)
hadoop-default.xml
hadoop-env.sh
hadoop-site.xml
2、
2、下面哪个程序负责 HDFS 数据存储。 (C)
A)NameNode
B)Jobtracker
B)Jobtracker
C)Datanode D)secondaryNameNode
3、下列关于 Hadoop API 的说法错误的是(A)
Hadoop 的文件 API 不是通用的,只用于 HDFS 文件系统
Configuration 类的默认实例化方法是以 HDFS 系统的资源配置为基础的
FileStatus 对象存储文件和目录的元数据
FSDataInputStream 是 java.io.DataInputStream 的子类
4、HDfS 中的 block 默认保存几份? (A)
3 份
2 份
1 份
不确定
5、为销售报表展示开发一个MapReduce 作业,Mapper 输入数据的Key 是年份(IntWritable), Value 表示商品标识(Text)。下列哪一项决定该 Mapper 的数据类型?(D)
JobConf.setMapInputKeyClass 与 JobConf.setMapInputValuesClass
HADOOP_MAP_DATATYPES 环境变量
随作业一起提交的 mapper-specification.xml 文件
InputFormat 格式类
6、HDFS 无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括
(D)
利用 SequenceFile、MapFile、Har 等方式归档小文件
多 Master 设计
Block 大小适当调小
调大namenode 内存或将文件系统元数据存到硬盘里
7、下列哪个程序通常与 NameNode 在一个节点启动?(D)
a)SecondaryNameNode b)DataNode c)TaskTracker d)Jobtracker
8、下面与 HDFS 类似的框架是?(C)
NTFS
FAT32
GFS
EXT3
9 、HDFS 的是基于流数据模式访问和处理超大文件的需求而开发的,默认的最基本的存储单位是 64M,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是
10、HBase 中的批量加载底层使用(A)实现。A MapReduce B HiveC Coprocessor D Bloom Filter(C
10、HBase 中的批量加载底层使用(A)实现。
A MapReduce B Hive
C Coprocessor D Bloom Filter
三、简答题(将正确的答案写入答题纸中。每题5 分,共 20 分)
1
1、简述下 HDFS 数据读流程;
答:步骤如下,能大致描述清楚流程,没
您可能关注的文档
最近下载
- 急救中心建筑设计规范.docx VIP
- flac3d5.0软件隧道支护与开挖命令流.docx VIP
- 2025中国华电校园招聘笔试参考题库附带答案详解.docx
- 西北大学自考学位英语真题.pdf VIP
- HXD1C型电力机车网控制系统.pdf VIP
- 创意写作教程 第二版 课件全套 葛红兵 第1--13章 绪论、突破作家障碍---政务文书与商务文书写作.pptx
- 风力发电场高处作业安全规程,NB_T31052-2014.pdf VIP
- 中国瘢痕修复诊疗指南(2025版).docx VIP
- 网课超星尔雅光影中国选修课答案光影中国尔雅答案.docx VIP
- 2025小学教科版(2024)科学一年级下册教学设计(附目录).docx
原创力文档

文档评论(0)