数据计算课程考试题目汇编.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据计算课程考试题目汇编

《数据计算》课程考试题目 、题a)NameNode b)Jobtracker c)Datanode d)SecondaryNameNode e)tasktracker 答案: C Datanode 2. HDFS 中的 block 默认保存几份? a)3 份 b)2 份 c)1 份 d)不确定 答案: A 默认 3 份 3. Hadoop 作者 a)Martin Fowler b)Kent Beck c)Doug cutting 答案: C Doug cutting 4.关于 SecondaryNameNode 哪项是正确的? a)它是 NameNode 的热备 b)它对内存没有要求 c)它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间 d)SecondaryNameNode 应与 NameNode 部署到一个节点 答案: C。 5.下列哪项通常是集群的最主要瓶颈 a)CPU b)网络 c)磁盘IO d)内存 答案:C 磁盘 首先集群的目的是为了节省成本,用廉价的 pc 机,取代小型机及大型机。小型机和大型机有什么特点? 1.cpu 处理能力强 2.内存够大,所以集群的瓶颈不可能是 a 和 d 3.如果是互联网有瓶颈,可以让集群搭建内网。每次写入数据都要通过网络(集群是内网),然后还要写入 3 份数据,所以 IO 就会打折扣。 二、填空题 分布式 2.HDFS 默认 Block Size是 64 MB。 3. MapReduce任务过程分为两个处理阶段:map阶段和reduce阶段。 4.Map/Reduce框架由一个单独的master?JobTracker?和每个集群节点一个slave?TaskTracker共同组成 5.MapReduce确保每个reducer的输入都是按键排序的。系统执行排序的过程(将map输出作为输入传给reducer)shuffle。 一、题题目 答:分布式计算是一门计算机科学,主要研究分布式系统。一个分布式系统包括若干通过网络互联的计算机。这些计算机互相配合以完成一个共同的目标(我们将这个共同的目标称为“项目”)。具体的过程是:将需要进行大量计算的项目数据分割成小块,由多台计算机分别计算,再上传运算结果后统一合并得出数据结论。在分布式系统上运行的计算机程序称为分布式计算程序;分布式编程就是编写上述程序的过程。 题目2:假如Namenode中没有数据会怎么样? 没有数据的Namenode就不能称之为Namenode,通常情况下,Namenode肯定会有数据。 题目3:在Hadoop HDFS中,中的周期性向信息?:adoop HDFS中,周期性地向中的D发送心跳信息和块报告。到信息说明该ataNode节点工作正常报告包含了ataNode节点上所有块的列表文件存储的映射关系。 adoop HDFS中,econdaryNameNode的主要作用是什么辅助ameNode,分担其工作量;定期合并文件(image)和编辑日志文件()推送给紧急情况下,可辅助恢复。 说明adoop YARN的一级管理与二级调度管理?分布式集群资源管理框架,可用于集群资源的管理以及应用的调度ARN的一级管理包括计算管理和pplication生命周期管理二级调度管理包括pplication内部计算模型的管理以及多样化计算的管理。 、题 题目2:请画出云计算的三层服务模型? 答:一般而言,云计算架构可以用三层SPI模型来表述。 基础设施即服务(IaaS,Infrastructrue as a Service) 这种把主机集中管理,以市场机制通过虚拟化层对外提供服务,用按使用量收费的盈利模式,形成了云计算的基础层。这就是基础设施即服务(IaaS,Infrastructrue as a Service),构成了云计算的基础层。平台即服务(PaaS,Platform as a Service) 平台即服务(PaaS)是指把一个完整的应用程序运行平台作为一种服务提供给客户。在这种服务模式中,客户不需要购买底层硬件和平台软件,只需要利用PaaS平台,就能够创建、测试和部署应用程序。 3软件即服务(SaaS,Software as a Service)在其概念可以这样来定义:把软件部署为托管服务,用户不需要购买软件,可以通过网络访问所需要的服务,或者把各种服务综合成自己的需要,而客户按照使用量付费。SaaS的出现彻底颠覆了传统软件的运营模式。它不仅仅从价格上,交付模式上,实施风险上带来了明显改观。在云计算上,SaaS有了更好的发展空间。而云计算的推出,给SaaS提供了更好的生态环境。这就形成了云计算的第三层:软件即服务(SaaS,Soft

您可能关注的文档

文档评论(0)

jiayou10 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档