hadoop常见笔试题答案.docVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
hadoop常见笔试题答案

Hadoop测试题 一.填空题,1分(41空),2分(42空)共125分 (每空1分) datanode 负责HDFS数据存储。 (每空1分)HDFS中的block默认保存 3 份。 (每空1分) ResourceManager 程序通常与 NameNode 在一个节点启动。 (每空1分)hadoop运行的模式有: 单机模式 、 伪分布模式 、 完全分布式 。 (每空1分)Hadoop集群搭建中常用的4个配置文件为: core-site.xml 、 hdfs-site.xml 、 mapred-site.xml 、 yarn-site.xml 。 (每空2分)HDFS将要存储的大文件进行 分割 , 分割 后存放在既定的存储块 中,并通过预先设定的优化处理,模式对存储的数据进行预处理,从而解决了大文件储存与计算的需求。 (每空2分)一个HDFS集群包括两大部分,即 namenode 与 datanode 。一般来说,一个集群中会有一个 namenode 和多个 datanode 共同工作。 (每空2分) namenode 是集群的主服务器,主要是用于对HDFS中所有的文件及内容数据进行维护,并不断读取记录集群中 datanode 主机情况与工作状态,并通过读取与写入镜像日志文件的方式进行存储。 (每空2分) datanode 在HDFS集群中担任任务具体执行角色,是集群的工作节点。文件被分成若干个相同大小的数据块,分别存储在若干个 datanode 上, datanode 会定期向集群内 namenode 发送自己的运行状态与存储内容,并根据 namnode 发送的指令进行工作。 (每空2分) namenode 负责接受客户端发送过来的信息,然后将文件存储位置信息发送给 client ,由 client 直接与 datanode 进行联系,从而进行部分文件的运算与操作。 (每空1分) block 是HDFS的基本存储单元,默认大小是 128M 。 (每空1分)HDFS还可以对已经存储的Block进行多副本备份,将每个Block至少复制到 3 个相互独立的硬件上,这样可以快速恢复损坏的数据。 (每空2分)当客户端的读取操作发生错误的时候,客户端会向 namenode 报告错误,并请求 namenode 排除错误的 datanode 后,重新根据距离排序,从而获得一个新的 的读取路径。如果所有的 datanode 都报告读取失败,那么整个任务就读取失败。 (每空2分)对于写出操作过程中出现的问题, FSDataOutputStream 并不会立即关闭。客户端向Namenode报告错误信息,并直接向提供备份的 datanode 中写入数据。备份 datanode 被升级为首选 datanode ,并在其余2个 datanode 中备份复制数据。NameNode对错误的DataNode进行标记以便后续对其进行处理。 (每空1分)格式化HDFS系统的命令为: hdfs namenode –format 。 (每空1分)启动hdfs的shell脚本为: start-dfs.sh 。 (每空1分)启动yarn的shell脚本为: start-yarn.sh 。 (每空1分)停止hdfs的shell脚本为: stop-dfs.sh 。 (每空1分)hadoop创建多级目录(如:/a/b/c)的命令为: hadoop fs –mkdir –p /a/b/c 。 (每空1分)hadoop显示根目录命令为: hadoop fs –lsr 。 (每空1分)hadoop包含的四大模块分别是: Hadoop common 、 HDFS 、 Mapreduce 、 yarn 。 (每空1分)namenode默认的WebUI访问端口号为: 50070 。 (每空1分)ResourceManager默认的WebUI访问端口号为: 8088 。 (每空1分)historyServer默认的WebUI访问端口号为: 19888 。 (每空1分)修改blocksize大小的属性是: dfs.blocksize ,在 hdfs-site.xml 配置文件里。 (每空1分)HDFS中namenode的RPC端口号为: 8021 ,其作用是: 接收Client连接的RPC端口,用于获取文件系统metadata信息 。 (每空2分)Mapper类中有 4 个函数。 (每空1分)默认N

文档评论(0)

zsmfjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档