- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大数据开发基础(试卷编号1201)
1.[单选题]在HBase中,过滤器顶层抽象类是()
A)Filter
B)FilterList
C)WhileMatchFilter
D)SkipFilter
答案:A
解析:
2.[单选题]假设我们要解决一个二类分类问题,我们已经建立好了模型,输出是0或1,初始时设阈
值为0.5,超过0.5概率估计,就判别为1,否则就判别为0;如果我们现在用另一个大于0.5的阈值,
那么现在关于模型说法,正确的是:
A)模型分类的召回率会降低或不变
B)模型分类的召回率会升高
C)模型分类准确率会升高或不变
D)模型分类准确率会降低
答案:A
解析:
3.[单选题]情感信息抽取不包括以下哪些方法?()
A)基于命名实体识别的抽取方法
B)基于重复段落的识别方法
C)基于语义角色标注的抽取方法
D)基于监督学习抽取的学习方法
答案:B
解析:
4.[单选题]在增量同步阶段,源数据库和目标数据库之间的同步有时会存在一个时间差,称为:(
),单位为秒。
A)延误
B)延后
C)延迟
D)时延
答案:D
解析:
5.[单选题]()是存储在计算机内的有结构的数据集合
A)网络系统
B)数据库系统
C)操作系统
D)数据库
答案:D
解析:
6.[单选题]信息技术发展史上的第二次信息化浪潮发生在().
A)1950年前后
B)1980年前后
C)1995年前后
D)2010年前后
答案:C
解析:
7.[单选题]大数据计算服务的数据仓库的管理员发现用户表user没有备注信息,为了方便其他人员
的使用,可以通过()方式给这张表加上备注。
A)altertableusersetcomment’mycomment’;
B)删除表user,在重建时指定comment选项
C)touchtableusersetcommnt’mycomment’;
D)changetableusersetcomment’mycomment;
答案:A
解析:
8.[单选题]当()时,可以不考虑RDD序列化处理。
A)完成成本比较高的操作后
B)执行容易失败的操作之前
C)RDD被重复使用
D)实时性要求高
答案:D
解析:RDD的序列化处理主要在完成成本比较高的操作之后、执行容易失败的操作之前、当RDD被
重复使用或者计算其代价很高时进行。
9.[单选题]以下变量名中错误的是()。
A)my_string_1
B)1st_string
C)foo
D)_
答案:B
解析:
10.[单选题]互联网信息化的发展的动力是()
A)技术创新
B)原创性创新
C)机制创制
D)模式创新
答案:C
解析:
11.[单选题]下列Python语法表述不正确的是
A)if语句的第二行必须有缩进
B)while语句的第二行必须有缩进
C)else后不加冒号
D)while循环语句的条件之后必须有冒号
答案:C
解析:
12.[单选题]()是指理解挖掘项目的目标业务需求。
A)业务理解
B)数据理解
C)数据准备
D)数据建模
答案:A
解析:根据跨行业数据挖掘标准流程(cross-industrystandardprocessfordatamining,
CRISP-DM)模型,业务理解是指从业务的角度了解项目的要求和最终目的,并将这些目的与数据挖
掘的定义以及结果结合起来。
13.[单选题]下列关于在Matplotlib的说法正确的是()。
A)散点图不能在子图中绘制
B)散点图的x轴刻度必须为数值
C)折线图可以用作查看特征间的趋势关系
D)箱线图可以用来查看特征间的相关关系
311
答案:C
解析:A、B选项,散点图可以在子图中绘制且x轴刻度可以是文本等非数值,D选项中箱线图由于
查看数据的分布。
14.[单选题]以下图像分割方法中,属于基于图像灰度分布的阈值方法的是
A)区域合并、分裂法
B)最大类间、内方差比法
C)已知形状的曲线检测
D)区域生长法
答案:B
解析:
15.[单选题]有关python,下列说法不正确的是?
A)Python是一门面向对象的解释性程序设计语言
B)Python程序的可以在IDLE和pycharm里进行开发
C)Python功能很强大,可以编写网页和游戏
D)Python只能在Windows系统下编写
答案:D
解析:
16.[单选题
文档评论(0)