- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大数据导论期末考试试卷
题量:27满分:100.0截止日期:2020-06-2516:00
一、单选题
1.分布式系统比较常见的数据分布方式有()
A、哈希方式
B、按数据范围分布
C、按数据量分布
D、一致性哈希
E、以上都是
我的答案:E
2.以下选项不属于可视化基本特征的是()
A、易懂性
B、全面性
C、必然性
D、专业性
我的答案:B
3.数据清洗的方法有()
A、填充缺失值
B、修改错误值
C、消除重复记录
D、以上都是
我的答案:D
4.以下不属于云计算的服务模式的选项是()
A、IaaS
B、PaaS
C、SaaP
D、SaaS
我的答案:C
5.哪一年是中国的微博元年?
A、2008
B、2009
C、2010
D、2011
我的答案:C
6._是大数据的前沿技术。
A、数据处理
B、数据分析
C、数据定义
D、数据结构
我的答案:B
7.大数据赖以生存的土壤是_。
A、互联网
B、物联网
C、网络信息
D、前沿技术
我的答案:A
二、多选题
1.以下是大数据存储面临的挑战的选项是()
A、系统问题
B、数据问题
C、应用问题
D、管理问题
我的答案:ACD
2.目前来说,以下选项是解决数据集成的主要难题的是。
A、异构性
B、
分布性
C、自治性
D、同构性
我的答案:AB
3.数据挖掘常用算法有()
A、分类
B、聚类
C、特征分析
D、决策树归纳法
我的答案:ABCD
4.大数据的采集方法有()
A、系统日志采集方法
B、网络数据采集方法
C、数据库采集
D、以上都不正确
我的答案:AB
5.以下属于云计算的特点的是()
A、资源池弹性可扩张
B、虚拟化
C、以人为中心
D、高可靠和安全性
我的答案:ABD
三、判断题
1.大数据分析是大公司或是科技大厂的专利。
我的答案:×
2.数据预处理是指在主要的处理后对数据进行的一些处理。
我的答案:×
3.只要有数据,就必然存在安全与隐私的问题。
我的答案:√
4.在数据处理方面,有一个著名的“一秒定律”,即要在秒级时间范围内给出分析结果,超出这个时间,数据就失去价值。
我的答案:√
5.与Oracle性能关系最大的是SGA。
我的答案:√
四、填空题
1.存储系统的类别有()、()、()
我的答案:
第一空:块存储
第二空:文件存储
第三空:对象存储
2.NoSQL数据库是()的缩写。
我的答案:
第一空:NotOnlySQL
3.()是大数据分析和应用的基础,()和()是数据分析的第一步。
我的答案:
第一空:数据
第二空:数据采集
第三空:预处理
4.大数据的4V特征分别是(),(),(),()
我的答案:
第一空:容量大(Volume)
第二空:多样性(Variety)
第三空:价值高(Value)
第四空:速度快(Velocity)
5.Hadoop核心模块包括()和()
我的答案:
第一空:HDFS
第二空:MapReduce
五、简答题
1.列举常用的大数据可视化软件与工具。
我的答案:
Excel
Processing
ECharts
2.数据集市与数据仓库的区别。
我的答案:
数据仓库向各个数据集市提供数据。前者是企业级,规模较大,后者是部门级,相对规模较小。
若干个部门的数据集市组成一个数据仓库。数据集市开发周期短、速度快,数据仓库开发周期长、速度慢。
从其数据特征进行分析,数据仓库中数据结构采用规范化模式,数据集市中的数据结构采用星型模式。通常数据仓库中的数据粒度比数据集市中的粒度要细。
3.述数据仓库的构建步骤。
我的答案:
数据抽取、数据转换、数据装载、元数据管理
4.请回答大数据的4V特征?
我的答案:
容量大(Volume)
多样性(Variety)
价值高(Value)
速度快(Velocity)
5.简述什么是数据采集?
我的答案:
是大数据生命周期中的第一个环节,通过RFID射频数据、传感器数据、社交网络数据、移动互联网数据等方式获得各种类型的结构化、半结构化、即非结构化的海量数据。
您可能关注的文档
- 商品采购明细表清单.xls
- 二次配cost-down(最新整理版).xls
- (完整版)部编版二年级上册语文背诵内容.docx
- 团支部元旦活动策划.doc
- 信息技术与美术教学的整合(精选5篇).docx
- 户型宣传广告.doc
- 秦皇岛广播电视大学现场模拟导游大赛.doc
- 市场调查计划表-2.doc
- 顾客投诉登记表.doc
- 计算机培训教学计划.doc
- GB/T 42125.2-2024测量、控制和实验室用电气设备的安全要求 第2部分:材料加热用实验室设备的特殊要求.pdf
- GB/T 42125.18-2024测量、控制和实验室用电气设备的安全要求 第18部分:控制设备的特殊要求.pdf
- GB/T 15972.40-2024光纤试验方法规范 第40部分:传输特性的测量方法和试验程序 衰减.pdf
- 中国国家标准 GB/T 15972.40-2024光纤试验方法规范 第40部分:传输特性的测量方法和试验程序 衰减.pdf
- 《GB/T 15972.40-2024光纤试验方法规范 第40部分:传输特性的测量方法和试验程序 衰减》.pdf
- GB/T 17626.36-2024电磁兼容 试验和测量技术 第36部分:设备和系统的有意电磁干扰抗扰度试验方法.pdf
- 中国国家标准 GB/T 17626.36-2024电磁兼容 试验和测量技术 第36部分:设备和系统的有意电磁干扰抗扰度试验方法.pdf
- 《GB/T 17626.36-2024电磁兼容 试验和测量技术 第36部分:设备和系统的有意电磁干扰抗扰度试验方法》.pdf
- GB/T 18851.1-2024无损检测 渗透检测 第1部分:总则.pdf
- 《GB/T 18851.1-2024无损检测 渗透检测 第1部分:总则》.pdf
最近下载
- 《固废基胶凝材料应用技术规程》.docx
- 农村小学六年级学生英语自主学习现状调查研究.doc
- 柯尼卡美能达 柯美 bh 246 236 226 216 206 复印机中文维修手册 (1).pdf
- 2024-2025学年人教版英语八年级上册期末复习专项课件-阅读.pptx VIP
- 超星学习通网课《形象管理》尔雅答案2025题目及答案.docx
- ISO17025(GBT27025)-实验室认可质量手册-(第一部分).docx VIP
- 什么是健康中国战略.pptx
- 基础设施事业部新员工提前转正考核测试.doc VIP
- 食品生产日常监督检查.ppt
- 2023年华侨大学计算机应用技术专业《计算机组成原理》科目期末试卷B(有答案).docx VIP
文档评论(0)