贵州省专业技术人员公需科目(大数据)测试试题及答案.docxVIP

贵州省专业技术人员公需科目(大数据)测试试题及答案.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

贵州省专业技术人员公需科目(大数据)测试试题及答案

一、单项选择题(每题2分,共20题,计40分)

1.大数据的4V特征不包括以下哪一项()

A.Volume(大量)

B.Velocity(高速)

C.Variety(多样)

D.Value(价格)

答案:D。大数据的4V特征分别是Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值),而不是价格,所以选D。

2.以下哪种数据类型不属于结构化数据()

A.关系型数据库中的数据

B.文本文件中的数据

C.财务报表数据

D.学生成绩表数据

答案:B。结构化数据是指可以用二维表结构来逻辑表达实现的数据,如关系型数据库、财务报表、学生成绩表数据等。文本文件中的数据可能是半结构化或非结构化的,所以选B。

3.以下哪个不是常见的大数据存储系统()

A.HBase

B.MongoDB

C.MySQL

D.Cassandra

答案:C。HBase、MongoDB、Cassandra都是常见的适合大数据存储的系统。MySQL是传统的关系型数据库,虽然也可以存储数据,但在处理大数据的高并发、海量数据存储等方面不如专门的大数据存储系统,所以选C。

4.数据挖掘中的关联规则挖掘主要用于发现()

A.数据中的频繁模式

B.数据中的分类规则

C.数据中的聚类信息

D.数据中的异常点

答案:A。关联规则挖掘主要是发现数据集中不同项目之间的频繁模式,比如超市购物篮分析中发现哪些商品经常一起被购买。分类规则挖掘用于对数据进行分类;聚类分析用于发现数据中的聚类信息;异常检测用于发现数据中的异常点,所以选A。

5.大数据处理框架Hadoop中的HDFS是指()

A.分布式计算系统

B.分布式存储系统

C.资源管理系统

D.数据挖掘系统

答案:B。HDFS(HadoopDistributedFileSystem)是Hadoop中的分布式存储系统,用于存储大规模的数据。MapReduce是Hadoop的分布式计算系统;YARN是资源管理系统;Hadoop本身不是专门的数据挖掘系统,所以选B。

6.Spark是一个()的大数据处理框架。

A.基于内存计算

B.基于磁盘计算

C.基于云计算

D.基于网格计算

答案:A。Spark是基于内存计算的大数据处理框架,它将数据存储在内存中进行快速计算,相比基于磁盘计算的Hadoop等框架,能显著提高计算速度,所以选A。

7.以下哪种算法常用于大数据的分类任务()

A.K-Means算法

B.Apriori算法

C.NaiveBayes算法

D.DBSCAN算法

答案:C。NaiveBayes算法是一种常用的分类算法,可用于大数据的分类任务。K-Means算法和DBSCAN算法是聚类算法;Apriori算法是关联规则挖掘算法,所以选C。

8.数据可视化的主要目的是()

A.存储数据

B.处理数据

C.更直观地展示数据

D.加密数据

答案:C。数据可视化是将数据以图形、图表等直观的形式展示出来,让用户更直观地理解数据的特征、趋势等,而不是用于存储、处理或加密数据,所以选C。

9.以下哪个平台是阿里云提供的大数据处理平台()

A.MaxCompute

B.BigQuery

C.Redshift

D.Snowflake

答案:A。MaxCompute是阿里云提供的大数据处理平台。BigQuery是Google云的大数据分析服务;Redshift是Amazon的数据仓库服务;Snowflake是云数据仓库平台,所以选A。

10.流式数据处理的特点不包括()

A.数据实时性强

B.数据持续到达

C.数据量小

D.对处理速度要求高

答案:C。流式数据处理针对的是持续到达的实时数据,数据实时性强,对处理速度要求高,通常数据量较大而不是小,所以选C。

11.以下哪种数据清洗操作可以处理数据中的缺失值()

A.数据归一化

B.数据去重

C.插值法

D.数据离散化

答案:C。插值法是一种处理数据中缺失值的方法,通过已知数据点来估算缺失值。数据归一化是将数据按比例缩放;数据去重是去除重复的数据;数据离散化是将连续数据转换为离散数据,所以选C。

12.大数据安全面临的主要挑战不包括()

A.数据泄露

B.数据访问控制

C.数据量小

D.恶意攻击

答案:C。大数据安全面临数据泄露、数据访问控制、恶意攻击等挑战,而大数据的特点是数据量大,不是数据量小,所以选C。

13.以下哪个工具可用

文档评论(0)

每一天都很美好 + 关注
实名认证
文档贡献者

加油,继续努力

1亿VIP精品文档

相关文档