网站大量收购独家精品文档,联系QQ:2885784924

19年大数据试题及答案.docx

19年大数据试题及答案.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

19年大数据试题及答案

姓名:____________________

一、选择题(每题2分,共20分)

1.以下哪个不是大数据技术的核心特点?

A.数据量大

B.数据多样性

C.数据价值高

D.数据处理速度快

2.以下哪个不是大数据分析的基本步骤?

A.数据收集

B.数据存储

C.数据清洗

D.数据加密

3.以下哪个不是大数据的四大V特点?

A.Volume(体量)

B.Velocity(速度)

C.Variety(多样性)

D.Veracity(真实性)

4.以下哪个不是Hadoop的组件?

A.HDFS

B.YARN

C.MapReduce

D.Spark

5.以下哪个不是数据挖掘的主要方法?

A.决策树

B.聚类分析

C.关联规则挖掘

D.概率论

6.以下哪个不是大数据在金融领域的应用?

A.风险评估

B.个性化推荐

C.交易分析

D.数据可视化

7.以下哪个不是大数据在医疗领域的应用?

A.疾病预测

B.个性化医疗

C.药物研发

D.数据安全

8.以下哪个不是大数据在交通领域的应用?

A.交通安全

B.交通优化

C.交通事故预测

D.车联网

9.以下哪个不是大数据在电子商务领域的应用?

A.用户画像

B.个性化推荐

C.供应链管理

D.数据安全

10.以下哪个不是大数据在社交媒体领域的应用?

A.情感分析

B.话题分析

C.用户画像

D.数据安全

二、填空题(每题2分,共20分)

1.大数据技术主要包括______、______、______等。

2.Hadoop的三大核心组件是______、______、______。

3.数据挖掘的主要方法包括______、______、______等。

4.大数据在金融领域的应用主要包括______、______、______等。

5.大数据在医疗领域的应用主要包括______、______、______等。

6.大数据在交通领域的应用主要包括______、______、______等。

7.大数据在电子商务领域的应用主要包括______、______、______等。

8.大数据在社交媒体领域的应用主要包括______、______、______等。

三、简答题(每题5分,共20分)

1.简述大数据技术的核心特点。

2.简述Hadoop的架构。

3.简述数据挖掘的基本步骤。

4.简述大数据在金融领域的应用。

5.简述大数据在医疗领域的应用。

四、论述题(每题10分,共20分)

1.论述大数据技术在现代社会的意义及其发展趋势。

2.论述大数据在提升企业竞争力方面的作用。

五、应用题(每题15分,共30分)

1.假设你是一家电商平台的运营人员,请设计一个基于大数据的用户画像分析方案,并简要说明如何利用用户画像进行精准营销。

2.假设你是一家医疗机构的IT人员,请设计一个基于大数据的疾病预测系统,并简要说明如何利用该系统提高疾病预防能力。

六、编程题(每题20分,共40分)

1.编写一个Python程序,实现以下功能:读取一个文本文件,统计其中每个单词出现的次数,并按出现次数降序排列输出。

2.编写一个Java程序,实现以下功能:使用Hadoop的MapReduce框架,对一组文本文件进行词频统计,并输出每个单词及其出现的次数。

试卷答案如下:

一、选择题答案及解析思路:

1.D(数据加密不是大数据技术的核心特点,而是一个数据安全的概念。)

2.D(数据加密不是大数据分析的基本步骤,而是数据保护的一部分。)

3.D(Veracity不是大数据的四大V特点,真实性是数据质量的一个方面。)

4.D(Spark是大数据处理框架之一,但不是Hadoop的组件。)

5.D(概率论是统计学的一个分支,不是数据挖掘的主要方法。)

6.D(数据安全不是大数据在金融领域的应用,而是数据管理的一个方面。)

7.D(数据安全不是大数据在医疗领域的应用,而是数据保护的一个方面。)

8.D(车联网不是大数据在交通领域的应用,而是一个技术概念。)

9.D(数据安全不是大数据在电子商务领域的应用,而是数据管理的一个方面。)

10.D(数据安全不是大数据在社交媒体领域的应用,而是数据保护的一个方面。)

二、填空题答案及解析思路:

1.数据处理技术、数据存储技术、数据分析技术

2.HDFS、YARN、MapReduce

3.决策树、聚类分析、关联规则挖掘

4.风险评估、个性化推荐、交易分析

5.疾病预测、个性化医疗、药物研发

6.交通安全、交通优化、交通事故预测

7.用户画像、个性化推荐、供应链管理

8.情感分析、话题分析、用户画像

三、简答题

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档