hadoop练习题--带答案.docVIP

下载本文档

1164
0
约1.93千字
约 3页
2018-09-29 发布于河北
举报
版权申诉

hadoop练习题--带答案.doc

1、本文档共3页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

hadoop练习题--带答案

Hadoop 练习题姓名：分数：单项选择题下面哪个程序负责HDFS数据存储。 NameNode Jobtracker Datanode √ secondaryNameNode tasktracker HDfS中的block默认保存几份？ 3份√ 2份 1份不确定下列哪个程序通常与NameNode在一个节点启动？ SecondaryNameNode DataNode TaskTracker Jobtracker√ Hadoop作者 Martin Fowler Kent Beck Doug cutting√ HDFS默认Block Size 32MB 64MB√ 128MB 下列哪项通常是集群的最主要的性能瓶颈 CPU 网络磁盘√ 内存关于SecondaryNameNode哪项是正确的？它是NameNode的热备它对内存没有要求它的目的是帮助NameNode合并编辑日志，减少NameNode启动时间√ SecondaryNameNode应与NameNode部署到一个节点一个gzip文件大小75MB，客户端设置Block大小为64MB，请我其占用几个Block？ 1 2√ 3 4 HDFS有一个gzip文件大小75MB，客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为？ 64MB 75MB√ 一个map读取64MB，另外一个map读取11MB HDFS有一个LZO（with index）文件大小75MB，客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为？ 64MB 75MB 一个map读取64MB，另外一个map读取11MB√ 多选题：下列哪项可以作为集群的管理工具 Puppet√ Pdsh√ Cloudera Manager√ Rsync + ssh + scp√ 配置机架感知的下面哪项正确如果一个机架出问题，不会影响数据读写√ 写入数据的时候会写到不同机架的DataNode中√ MapReduce会根据机架获取离自己比较近的网络数据√ Client端上传文件的时候下列哪项正确数据经过NameNode传递给DataNode Client端将文件以Block为单位，管道方式依次传到DataNode√ Client只上传数据到一台DataNode，然后由NameNode负责Block复制工作当某个DataNode失败，客户端会继续传给其它DataNode √ 下列哪个是Hadoop运行的模式单机版√ 伪分布式√ 分布式√ Cloudera提供哪几种安装CDH的方法 Cloudera manager√ Tar ball√ Yum√ Rpm√ 判断题：（全部错） Ganglia不仅可以进行监控，也可以进行告警。（） Nagios不可以监控Hadoop集群，因为它不提供Hadoop支持。（）如果NameNode意外终止，SecondaryNameNode会接替它使集群继续工作。（） Cloudera CDH是需要付费使用的。（） Hadoop是Java开发的，所以MapReduce只支持Java语言编写。（） Hadoop支持数据的随机写。（） NameNode负责管理metadata，client端每次读写请求，它都会从磁盘中读取或则会写入metadata信息并反馈client端。（） NameNode本地磁盘保存了Block的位置信息。（） Slave节点要存储数据，所以它的磁盘越大越好。（） Hadoop默认调度器策略为FIFO，并支持多个Pool提交Job。（）集群内每个节点都应该配RAID，这样避免单磁盘损坏，影响整个节点运行。（）因为HDFS有多个副本，所以NameNode是不存在单点问题的。（）每个map槽就是一个线程。（） Mapreduce的input split就是一个block。（） Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是200MB。（） DataNode首次加入cluster的时候，如果log中报告不兼容文件版本，那需要NameNode执行“hadoop namenode -format”操作格式化磁盘。（） Hadoop1.0和2.0都具备完善的HDFS HA策略。（） GZIP压缩算法比LZO更快。（） PIG是脚本语言，它与mapreduce无关。（）