- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据开发基础(试卷编号222)
说明:答案和解析在试卷最后
1.[单选题]Hadoop fs中的-get和-put命令操作对象是
A)文件
B)目录
C)两者都是
2.[单选题]如果我们说线性回归模型完美地拟合了训练样本(训练样本误差为零),则下面说法正确的
是()。
A)测试样本误差始终为零
B)测试样本误差不可能为零
C)以上答案都不对
3.[单选题]Kafka集群必须依赖于下列哪一个组件?
A), HDFS
B)Yarn
C)Flume
D)Zookeeper
4.[单选题]k-means算法中K指的是:()
A)K个样本
B)K个质心
C)K次迭代
D)K次方
5.[单选题]以下关于Zookeeper的Leader节点在接收到数据变更请求后的读写流程说法正确的是:(
)。
A)仅写入内存
B)同时写入硬盘和内存
C)先写入内存再写入硬盘
D)先写入硬盘再写入内存
6.[单选题]绝对多数投票法的基本思想是( )
A)对于若干和弱学习器的输出进行平均得到最终的预测输出咱少数服从多数,数量最多的类别为最
终的分类类别
B)不光要求获得最高票,还要求票过半数
C)将训练集弱学习器的学习结果作为输入,
D)将训练集的输出作为输出,重新训练一 个学习器来得到最终结果
7.[单选题]HDFS中的主备仲裁,是由:( )组件控制的。
A)Zookeeper Failover Controller
B)NodeManager
C)ResourceManager
D)HDFS Client
8.[单选题]下列对图数据库描述正确的是?
A)存储图片的数据库
B)以“图”数据结构存储和查询数据的数据库
C)数据仓库的一种
D)与关系型数据库类似的数据库
9.[单选题]哪个选项不是实时检索解决方案的典型业务特点?()
A)查询条件简单
B)查询速度快
C)统计美查询
D)高并发
10.[单选题]泛在电力物联网的总体架构中,内部用户有作业层、管理层、()
A)执行层
B)决策层
C)建议层
D)推送层
11.[单选题]下列有关HDFS的容错机制描述错误的是( )。
A)HDFS可以使用机架位感知的方法实现容错机制
B)HDFS可以使用基于erasure code的方法实现容错机制
C)HDFS使用机架位感知的方法先把一份拷贝放入同机架上的机器,然后在拷贝一份到其他服务器
D)HDFS使用机架位感知的方法先把一份拷贝放入同机架上的机器,然后在拷贝一份到同机架机器的
不同位置上
12.[单选题]以下哪些选项不属于大数据时代到来的必要条件?
A)网络带宽提升
B)存储设备容量提升
C)CPU计算性能提升
D)超级计算机的出现
13.[单选题]关于数据仓库Impala的描述错误的是:( )
A)Impala作为开源大数据分析引擎,支持实时计算,它提供了与Hive类似的功能,并在性能上比
Hive高出3~30倍
B)Impala是由Cloudera公司开发的查询系统
C)Impala提供了SQL语义,能查询存储在Hadoop的HDFS和HBase上的PB级别海量数据
D)Impala最初是参照MySQL系统进行设计的
14.[单选题]HBase依靠( )存储底层数据。
A)HDFS
B)Hadoop
C)Memory
D)MapReduce
15.[单选题]numpy默认产生的数据类型是(__)。
A)int16
B)float32
C)char
D)float64
16.[单选题]支持向量回归与传统回归模型的差别是()。
A)模型输出与真实值相同
B)模型输出与真实值存在ε偏差
C)模型输出大于真实值
D)模型输出小于真实值
17.[单选题]关于 HIVE 的描述不正确的是?
A)Hive 最佳使用场景是大数据集的批处理作业
B)Hive 可以实现在大规模数据集上实现低延迟快速的查询、
C)ive 构建在基于静态批量处理的Hadoop 之上,Hado
文档评论(0)