大数据开发基础(试卷编号1201) .pdfVIP

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

大数据开发基础(试卷编号1201)

1.[单选题]在HBase中,过滤器顶层抽象类是()

A)Filter

B)FilterList

C)WhileMatchFilter

D)SkipFilter

答案:A

解析:

2.[单选题]假设我们要解决一个二类分类问题,我们已经建立好了模型,输出是0或1,初始时设阈

值为0.5,超过0.5概率估计,就判别为1,否则就判别为0;如果我们现在用另一个大于0.5的阈值,

那么现在关于模型说法,正确的是:

A)模型分类的召回率会降低或不变

B)模型分类的召回率会升高

C)模型分类准确率会升高或不变

D)模型分类准确率会降低

答案:A

解析:

3.[单选题]情感信息抽取不包括以下哪些方法?()

A)基于命名实体识别的抽取方法

B)基于重复段落的识别方法

C)基于语义角色标注的抽取方法

D)基于监督学习抽取的学习方法

答案:B

解析:

4.[单选题]在增量同步阶段,源数据库和目标数据库之间的同步有时会存在一个时间差,称为:(

),单位为秒。

A)延误

B)延后

C)延迟

D)时延

答案:D

解析:

5.[单选题]()是存储在计算机内的有结构的数据集合

A)网络系统

B)数据库系统

C)操作系统

D)数据库

答案:D

解析:

6.[单选题]信息技术发展史上的第二次信息化浪潮发生在().

A)1950年前后

B)1980年前后

C)1995年前后

D)2010年前后

答案:C

解析:

7.[单选题]大数据计算服务的数据仓库的管理员发现用户表user没有备注信息,为了方便其他人员

的使用,可以通过()方式给这张表加上备注。

A)altertableusersetcomment’mycomment’;

B)删除表user,在重建时指定comment选项

C)touchtableusersetcommnt’mycomment’;

D)changetableusersetcomment’mycomment;

答案:A

解析:

8.[单选题]当()时,可以不考虑RDD序列化处理。

A)完成成本比较高的操作后

B)执行容易失败的操作之前

C)RDD被重复使用

D)实时性要求高

答案:D

解析:RDD的序列化处理主要在完成成本比较高的操作之后、执行容易失败的操作之前、当RDD被

重复使用或者计算其代价很高时进行。

9.[单选题]以下变量名中错误的是()。

A)my_string_1

B)1st_string

C)foo

D)_

答案:B

解析:

10.[单选题]互联网信息化的发展的动力是()

A)技术创新

B)原创性创新

C)机制创制

D)模式创新

答案:C

解析:

11.[单选题]下列Python语法表述不正确的是

A)if语句的第二行必须有缩进

B)while语句的第二行必须有缩进

C)else后不加冒号

D)while循环语句的条件之后必须有冒号

答案:C

解析:

12.[单选题]()是指理解挖掘项目的目标业务需求。

A)业务理解

B)数据理解

C)数据准备

D)数据建模

答案:A

解析:根据跨行业数据挖掘标准流程(cross-industrystandardprocessfordatamining,

CRISP-DM)模型,业务理解是指从业务的角度了解项目的要求和最终目的,并将这些目的与数据挖

掘的定义以及结果结合起来。

13.[单选题]下列关于在Matplotlib的说法正确的是()。

A)散点图不能在子图中绘制

B)散点图的x轴刻度必须为数值

C)折线图可以用作查看特征间的趋势关系

D)箱线图可以用来查看特征间的相关关系

311

答案:C

解析:A、B选项,散点图可以在子图中绘制且x轴刻度可以是文本等非数值,D选项中箱线图由于

查看数据的分布。

14.[单选题]以下图像分割方法中,属于基于图像灰度分布的阈值方法的是

A)区域合并、分裂法

B)最大类间、内方差比法

C)已知形状的曲线检测

D)区域生长法

答案:B

解析:

15.[单选题]有关python,下列说法不正确的是?

A)Python是一门面向对象的解释性程序设计语言

B)Python程序的可以在IDLE和pycharm里进行开发

C)Python功能很强大,可以编写网页和游戏

D)Python只能在Windows系统下编写

答案:D

解析:

16.[单选题

文档评论(0)

180****5471 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档