[南开大学]19秋学期(1709、1803、1809、1903、1909)《大数据导论》在线作业.docx

[南开大学]19秋学期(1709、1803、1809、1903、1909)《大数据导论》在线作业.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

19秋学期(1709、1803、1809、1903、1909)《大数据导论》在线作业-0002

------------------------

用于描述相等时间间隔下连续数据随时间变化趋势的是()

折线图

散点图

条形图

饼图

正确答案:A

下列不属于Google云计算平台技术架构的是()A.并行数据处理MapReduce

分布式锁Chubby

结构化数据表BigTable

弹性云计算EC2正确答案:D

用于描述数据分散情况的是()

分布图

箱式图

饼图

折线图正确答案:B

SAN是一种()

存储设备

专为数据存储而设计构建的网络

光纤交换机D.HBA

正确答案:B

IaaS是()的简称

软件即服务

平台即服务

基础设施即服务

硬件即服务正确答案:C

医疗健康数据的基本情况不包括以下哪项

诊疗数据

个人健康管理数据

公共安全数据

健康档案数据正确答案:C

数据清洗的方法不包括

缺失值处理

噪声数据清除

一致性检查

重复数据记录处理正确答案:D

下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()A.ggplot2

B.networkC.ggmapsD.animation正确答案:D

基础设施即服务的英文简称是A.IaaS

B.PaaSC.SaaS

正确答案:A

下面哪一项不是中国发展大数据产业的基础()。

信息化积累了丰富的数据资源

大数据技术创新取得明显突破

大数据应用推动势头良好

大数据产业支撑薄弱正确答案:D

11.()是MicrosoftOffice的核心组件A.SQL

B.WORDC.PPTD.EXCEL

正确答案:D

数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()。

运营式系统阶段

用户原创内容阶段

感知式系统阶段正确答案:C

PaaS是()的简称

软件即服务

平台即服务

基础设施即服务

硬件即服务正确答案:B

下列不属于商业大数据类型的是

传统企业数据

机器和传感器数据

社交数据

电子商务数据正确答案:B

以下不是数据仓库基本特征的是()

数据仓库是面向主题的

数据仓库是面向事务的

数据仓库的数据是相对稳定的

数据仓库的数据是反映历史变化的正确答案:B

------------------------

一个HDFS集群由一个##和##构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。

一个名字节点

若干个名字节点

一个数据节点

若干个数据节点正确答案:AD

数据预处理的过程主要是

数据清洗

数据集成

数据变换

数据规约

正确答案:ABCD

大数据的技术支撑有()

计算速度加快

存储成本下降

机器智能化

数据量增加正确答案:ABC

KNIME(KonstanzInformationMiner)是一个对用户友好的、智能、开源的平台。该平台包括了##、##、##、##。

数据集成

数据处理

数据分析

数据挖掘

正确答案:ABCD

大数据在社交网络中的应用

用户偏好、情感、社交网络结构

用户画像、精准推荐

舆情监控、突发事件预警

预测外部趋势正确答案:ABCD

大数据时代预测人类移动行为的数据特点是

多样化

数据量大

维数高

变化快

正确答案:BCD

大数据时代预测人类移动行为的数据来源有

志愿者定位数据

装有导航设备的出租车轨迹数据

手机终端定位于通讯记录

社会网络签到数据正确答案:ABCD

数据清洗(DataCleaning)的方法有()

填充空缺值

清除数据中的噪声

识别或删除离群点并解决不一致性正确答案:ABC

大数据存储的特点与挑战有()

容量问题

延迟问题

安全问题

成本问题

正确答案:ABCD

百度大脑包括()

深度学习

超大规模机器学习

大规模GPU并行化平台正确答案:ABC

按照数据量的大小,可将数据分析分为()

内存级数据分析

Bl级数据分析

海量级数据分析

巨量级数据分析正确答案:ABC

云计算是##,##,##的发展,是虚拟化、效用计算、IaaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务

)等概念混合演进并跃升的结果。

流计算

分布式计算

并行计算

网络计算正确答案:BCD

交通数据分析可用于:

交通流量实时分析

合理进行道路规划

信号灯智能调度

实时路况查询播报正确答案:ABCD

医疗领域如何利用大数据

临床决策支持

个性化医疗

社保资金安全

用户行为分析正确答案:ABCD

百度大数据引擎主要包含三大组件()

开放云

数据工厂

百度大脑。正确答案:ABC

------------------------

轨迹数据包含空间和时间属性,并且通常规模巨大且维度高

T.对

F.错

正确答案:T

FP-growth算法需要对数据库进行三次扫描

T.对

F.错

正确答案:F

R语言是S语言的实现,是一种B编译

文档评论(0)

159****1944 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档