大数据开发基础(习题卷11) .pdfVIP

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

大数据开发基础(习题卷11)

第1部分:单项选择题,共57题,每题只有一个正确答案,多选或少选均不得分。

1.[单选题]大数据时代的一大特征是万物互联与融合,下列说法错误的是()。

A)人均入网设备增加

B)融入各个领域行业

C)个人信息安全问题凸显

D)信息安全领域影响不大

答案:D

解析:

2.[单选题]字符串格式化使用函数

A)len

B)format

C)str

D)int

答案:B

解析:

3.[单选题]在制作图表时,为了实现在单个图表中的穿透,可以通过增加()实现

A)图层

B)筛选器

C)维度

D)度量

答案:A

解析:

4.[单选题]在大数据计算服务(MaxCompute,原ODPS)的MapReduce中可以使用资源(Resource,包括jar包、压缩文件

、表等)。在使用jar命令执行MR程序时,需要在参数resources中指定资源,以下说法正确的是:()。

A)包括已上传到大数据计算服务的MR程序本身所在的jar包,以及MR程序用到的大数据计算服务上的资源

B)仅包含MR程序中用到的大数据计算服务上的资源

C)仅包含保存在本地的MR程序本身所在的jar包

D)仅包含已上传到大数据计算服务的MR程序本身所在的jar包

答案:A

解析:

5.[单选题]下列选项描述错误的是?()

A)HadoopHA即集群中包含SecondaryNameNode作为备份节点存在。

B)ResourceManager负责的是整个Yarn集群资源的监控、分配和管理工作

C)NodeManager负责定时的向ResourceManager汇报所在节点的资源使用情况以及接收并处理来自ApplicationMaster的

启动停止容器(Container)的各种请求。

D)初次启动HadoopHA集群时,需要将格式化文件系统后的目录拷贝至另外一台

答案:A

解析:

6.[单选题]以下关于机器学习,描述错误的是:()

A)是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、.脑科学等诸多领域的交叉学科

题卷111/1

B)研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能

C)机器学习强调三个关键词:算法、模型、训练

D)基于数据的机器学习是现代智能技术中的重要方法之一

答案:C

解析:

7.[单选题]摩尔定律指出,当价格不变时,集成电路上可容纳的晶体管数目,约每隔()便会增加一倍,性能也将提升

一倍。

A)6个月

B)18个月

C)12个月

D)24个月

答案:B

解析:

8.[单选题]pandas中的解析函数read_cvs,默认的分隔符是(___)。

A)逗号

B)分号

C)“\t”

D)句号

答案:A

解析:

9.[单选题]()不属于C盯模型对于HMM和MEMM模型的优势

A)特征灵活

B)速度快

C)可容纳较多上下文信息

D)全局最优

答案:B

解析:

10.[单选题]关于过拟合下面说法错误的是()

A)过拟合是可以避免的

B)过拟合是训练过度使泛化能力下降

C)相比过拟合,欠拟合比较容易解决

D)根据少量训练记录做出分类决策的模型也容易受过分拟合的影响

答案:A

解析:

11.[单选题]a=np.array([1,0,0,3,4,5,0,8]),b=np.nonzero(a),则b[0]的值为()。

A)[0,3,4,5,7]

B)[1,3,4,5,8]

C)[03457]

D)[13458]

答案:A

解析:np.nonzero()函数是提取数组中不为0的下标,返回的结果为每一个位置的下标数组组成的元组。

12.[单选题]以下哪项不是“大数据”和传统的“小数据”的区别?

A)数据规模的采样聚合与全量

B)数据结构的结构化与非结构化

C)数据来源的集中于分散

题卷112/1

D)数据质量的高低参差不齐

答案:C

解析:

13.[单选题]通过()工作流节点可以按照百分比随机从数据表中抽取部分数据。

A)抽样

B)转换

C)行转列

D)分组标签

答案:A

解析:

14.[单选题]对数几率回归(logisticsregression)和一般

文档评论(0)

162****6576 + 关注
实名认证
文档贡献者

精品文档欢迎下载

1亿VIP精品文档

相关文档