大数据试题最新分析和总结.pdfVIP

  • 12
  • 0
  • 约8.15千字
  • 约 6页
  • 2021-07-11 发布于上海
  • 举报
一、填空题(将正确的答案写入答题纸中。每空 1 分,共 20 分) 1 、HDFS 有 _ NameNode__ _ ,_ DataNode__ _ 和_ SecondaryNameNode__ _ 组成; 2、Hadoop 集群可以运行在 _ 单机模式 __ _ ,_ 伪分布式模式 __ _ 和_ 完全分布式 模式 __ _ 3 个模式? 3、安装完全分布式 Apache Hadoop 的核心配置文件有 _ core-site.xml__ _ , _ hdfs- site.xml__ _ , _ mapred-site.xml__ _ , _ yarn-site.xml__ _ 。 4、HBase 中通过 _ HDFS__ _ 存储底层数据 ,通过 _ _Zookeeper_ _ 提供消息通信机制 5、HIVE 默认采用 _ _ Derby _ __ __ _ 数据库进行元数据的存储,而真实的数据是存储在 _ __HDFS __ __ _ 中。 6、如何在浏览器中查看 HDFS 运行状况的默认端口号是 _ 50070__ _ 查看 yarn 运行状态的 默认端口号是 _ 8088__ _ 7、HDFS 中当前 block 大小为 128M, 如果当前要上传到 HDFS 中的文件大小为 300M ,那 么在存储时会分配 _ 3__ _ 个 block 进行存储。 8、HDFS 获取根目录下的文件列表的命令 shell 命令是 _hadoop fs -ls -R / __ __ __ __ __ _ ;根目录下创建 hdfs 文件夹的 shell 命令是 _ _ hadoop fs -mkdir /hdfs__ __ __ __ _ 。 9、YARN 架构中整个集群同一时间提供服务的 ResourceManager 有_ 1__ _ 个,负责集群资 源的统一管理和调度。 二、选择题(将正确的答案写入答题纸中。每题 2 分,共 20 分) 1、配置 Hadoop 时, JAVA_HOME 包含在哪一个配置文件中 (B) A . hadoop-default.xml B . hadoop-env.sh C . hadoop-site.xml D . configuration.xs 2、下面哪个程序负责 HDFS 数据存储。 (C ) A)NameNode B)Jobtracker C)Datanode D)secondaryNameNode 3、下列关于 Hadoop API 的说法错误的是( A ) A . Hadoop 的文件 API 不是通用的,只用于 HDFS 文件系统 B . Configuration 类的默认实例化方法是以 HDFS 系统的资源配置为基础的 C . FileStatus 对象存储文件和目录的元数据 D . FSDataInputStream 是 java.io.DataInputStream 的子类 4、HDfS 中的 block 默认保存几份 ? (A ) A)3 份 B)2 份 C)1 份 D)不确定 5、为销售报表展示开发一个 MapReduce 作业,Mapper 输入数据的 Key 是年份 (IntWritable ), Value 表示商品标识( Text )。下列哪一项决定该 Mapper 的数据类型?( D ) A. JobConf.setMapInputKeyClass 与 JobConf.setMapInputValuesClass B. HADOOP_MAP_DA TATYPES 环境变量 C. 随作业一起提交的 mapper-specification.xml 文件 D. InputFormat 格式类 6、HDFS 无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括 (D ) A. 利

文档评论(0)

1亿VIP精品文档

相关文档