《大数据导论》在线作业.pdfVIP

  • 0
  • 0
  • 约7.03千字
  • 约 22页
  • 2024-05-06 发布于中国
  • 举报

一、单选题

共15题,30分

1

基础设施即服务的英文简称是

AIaaS

BPaaS

CSaaS

我的答案:A

2

用于描述相等时间间隔下连续数据随时间变化趋势的是()

A折线图

B散点图

C条形图

D饼图

我的答案:A

3

下列不属于商业大数据类型的是

A传统企业数据

B机器和传感器数据

C社交数据

D电子商务数据

我的答案:B

4

以下哪项不是数据可视化工具的特性()

A实时性

B简单操作

C更丰富的展现

D仅需一种数据支持方式即可

D

5

MapReduce中的Map和Reduce函数使用()进行输入输出

Akey/value对

B随机数值

C其他计算结果

我的答案:A

6

以下不是数据仓库基本特征的是()

A数据仓库是面向主题的

B数据仓库是面向事务的

C数据仓库的数据是相对稳定的

D数据仓库的数据是反映历史变化的

我的答案:B

7

IaaS是()的简称

A软件即服务

B平台即服务

C基础设施即服务

D硬件即服务

我的答案:C

8

大数据的最显著特征是()。

A数据规模大

B数据类型多样

C数据处理速度快

D数据价值密度高

我的答案:A

9

大数据的特点不包含

数据体量大

B价值密度高

C处理速度快

D数据不统一

我的答案:D

10

数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段()。

A运营式系统阶段

B用户原创内容阶段

C感知式系统阶段

我的答案:B

11

数据仓库是随着时间变化的,下列不正确的是()

A数据仓库随时间变化不断增加新内容

B捕捉到的新数据会覆盖原来的快照

C数据仓库随事件变化不断删去旧的数据内容

D数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合

我的答案:C

12

下列哪个工具常用来开发移动友好地交互地图()

ALeaflet

BVisual.ly

CBPizzaPieCharts

DGephi

我的答案:A

13

购物篮问题是

的典型案例

A数据变换

B关联规则挖掘

数据分类

我的答案:B

14

哪个选项不属于大数据4V特点?

AVolume

BValid

CVariety

DValue

我的答案:B

15

GFS中的文件切分成()的块进行存储

A32MB

B64MB

C128MB

D1G

我的答案:B

二、多选题

共15题,30分

1

大数据采集主要包括()四种。

A系统日志采集

B网络数据采集

C数据库采集

D其他数据采集

我的答案:ABCD

2

大数据智能感知层:主要包括()及软硬件资源接入系统

A数据传感体系

B网络通信体系

C传感适配体系

智能识别体系

我的答案:ABCD

3

去除噪声使得数据光滑的技术主要有:

A分箱

B回归

C离群点分析

我的答案:CBA

4

大数据的技术支撑有()

A计算速度加快

B存储成本下降

C机器智能化

D数据量增加

我的答案:ACB

5

它们把原数据变换或投影到较小的空间。

A小波变换

B中心化变换

C主成分分析

D对数变换

我的答案:AC

6

可使用进行光滑。

A最大值

B箱中位数

C箱边界

D箱均值

我的答案:CDB

7

A批处理

B流处理

C单个处理

D交叉处理

我的答案:AB

8

交通数据分析可用于:

A交通流量实时分析

B合理进行道路规划

C信号灯智能调度

D实时路况查询播报

我的答案:ABCD

9

统计图表的可视化方法主要包括()

A散点图

B折线图

C条形图

D饼图

我的答案:DCAB

10

医疗大数据特点:除了包含了大数据4个“V”的特点之外还有()

A多态性

B时效性

C不完整性

D冗余性

我的答案:BADC

11

百度大数据引擎主要包含三大组件()

A开放云

数据工厂

C百度大脑。

我的答案:CBA

12

层次方法可以分为()

AK均值算法

BK中心点算法

C凝聚法

D分裂法

我的答案:DC

13

网络数据采集常用的是通过或等方式从网站上获取数据信息。

A网络爬虫

B网站公开API

C手动获取

我的答案:AB

14

常见的分类方法有

A决策树

B贝叶斯网络

C遗传算法

文档评论(0)

1亿VIP精品文档

相关文档