ict大数据练习题与参考答案.docx

ict大数据练习题与参考答案.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

ict大数据练习题与参考答案

一、单选题(共62题,每题1分,共62分)

1.()将请求的源IP地址进行一致性Hash运算,得到一个具体的数值,同时对后端服务器进行编号,按照运算结果将请求分发到对应编号的服务器上。

A、加权轮询算法

B、加权最少连接

C、源IP算法

D、连接ID算法

正确答案:C

2.假设每个用户最低资源保障设置为yarn,scheduler,capacity,root,QueueA.minimum-user-limit-percent=24。则以下说法错误的是:()。

A、第3个用户提交任务时,每个用户最多获得33.33%的资源

B、第2个用户提交任务时每个用户最多获得50%的资源

C、第4个用户提交任务时,每个用户最多获得25%的资源

D、第5个用户提交任务时,每个用户最多获得20%的资源

正确答案:D

3.Spark是用以下()编程语言实现的。

A、C

B、C++

C、JAVA

D、Scala

正确答案:D

4.容器技术是企业云战略转型的关键,同时也是云原生(CloudNative)的核心,下列哪项不属于容器的三大好处?

A、资源利用率提升

B、秒级弹性

C、环境一致性,简化交付

D、复杂性增加

正确答案:D

5.以下不属于SWR产品优势的是()

A、完全自动化

B、镜像加速

C、简单易用

D、安全可靠

正确答案:A

6.负载均衡系统是基于cookie的会话保持,httpcookie的有效期为()小时?

A、24

B、4

C、12

D、48

正确答案:A

7.关于Hive自定义UDF描述错误的是?

A、永久函数,可以在多个会话中使用,不需要每次创建

B、用户定义表生成函数UDTF,用于接受多个输入数据行,并产生一个输入数据行

C、临时函数,只能在当会话使用,重启会话后需要重新创建

D、普通的UDF,用于操作单个数据行,且产主一个数据行为输出

正确答案:B

8.将数据块存储大小设置为128M,HDFS客户端在写文件时,当写入一个100M大小的文件,实际占用储存空间为:()。

A、128M

B、100M

C、64M

D、50M

正确答案:B

9.新建“表/文件迁移作业”作业第一步不需要填写的信息是:()。

A、字段名称

B、目的连接名称

C、源连接名称

D、作业名称

正确答案:A

10.部署组件时,不可以将软件包部署到()

A、OBS

B、FTP

C、SWR软件仓库

D、镜像仓库

正确答案:B

11.哪个是Kubernetes控制器?

A、ReplicaSet

B、Deployment

C、RollingUpdates

D、ReplicaSet和Deployment

正确答案:D

12.Hive创建()时,会将数据移动到数据仓库指向的路径,创建(),仅记录数据所在的路径,不对数据的位置做任何改交

A、内部表、元数据

B、内部表、外部表

C、外表、托管表

D、原元数据、外部表

正确答案:B

13.以下()和弹性IP的操作无关。

A、删除

B、绑定

C、释放

D、解绑

正确答案:A

14.以下关于数据仓库的描述正确的是?

A、数据仓库主要用于支持决策管理

B、存放在数据仓库中的数据均是实时更新的

C、数据仓库主要用于在线交易

D、数据仓库的数据源非常单一

正确答案:A

15.CVS日志放在。

A、/var/log/fusionsphere/component/elb-v3-controller/

B、/usr/local/NSP/nginx/logs/

C、/var/log/fusionsphere/component/cvs-agent/

D、/var/log/fusionsphere/component/

正确答案:B

16.不是EIP加入共享带宽好处的是:()。

A、方便管理

B、多个IP共用一条带宽

C、提升性能

D、节约成本

正确答案:C

17.对于运行在MapReduce平台上的应用程序,此应用程序所依赖的jar包会被放到()。

A、HIVE

B、HBASE

C、HDFS

D、DB

正确答案:C

18.在分类问题中,经常会遇到正负样本数据量不等的情况,比如正样本为100万条数据,负样本只有1万条数据,以下最合适的处理方法是(____)。

A、将负样本每个权重设置为100,正样本权重为1,参与训练过程

B、将负样本重复100次,生成100万样本量,打乱顺序参与分类

C、直接进行分类,可以最大限度利用数据

D、从100万正样本中随机抽取1万参与分类

正确答案:A

19.以下关于隐马尔科夫模型中,叙述错误的是(____)。

A、是一种无向图模型

B、是一种有向图模型

C、是一种结构简单的动态贝叶斯网络

D、常被应用于时序数据建模

正确答案:A

20.配置桶日志记录时,以下关于日志文件存

文档评论(0)

百知星球 + 关注
实名认证
内容提供者

精心梳理知识,畅快分享所得

1亿VIP精品文档

相关文档