- 3
- 0
- 约7.95千字
- 约 8页
- 2025-01-15 发布于河南
- 举报
不飞则已,一飞冲天;不鸣则已,一鸣惊人。——《韩非子》
HDFS已经成为了大数据磁盘存储的事实标准,针对关系型以外的数据模型,
开源社区形成了K-V(key-value)、列式、()、图这四类NoSQL数据库
体系。
A:数据仓库
B:文档
C:关系数据库
D:表格
答案
2.麦肯锡全球研究所对大数据的定义是()。
A:数据量庞大、产生速度快的数据成为大数据
B:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件
工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的
数据类型和价值密度低四大特征
C:大数据指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处
理的数据集合,是需要新处理模式才具有更强的决策力、洞察发现力和流程
化能力的海量、高增长率和多样化的信息资产
D:大数据是数据量庞大的数据集合
答案:B
3.大数据应用场景不包括()。
A:个性化服务
B:人群标签,精准营销
C:商品推荐
D:生活家用
答案:B
4.DataWorks是一个提供了大数据OS能力、并以allinonebox的方式提供
专业高效、安全可靠的一站式大数据智能云研发平台。同时能满足用户对
数据治理、质量管理需求,赋予用户对外提供数据服务的能力。()
A:对
B:错
答案:A
5.云原生数据仓库MySQL版(简称ADB,原AnalyticDBforMySQL)是一种
高并发低延时的PB级新一代云原生数据仓库,全面兼容MySQL协议以及
SQL:2003语法标准,可以毫秒级针对万亿级数据进行即时的多维分析透视
和业务探索。()
A:对
B:错
答案:A
吾日三省乎吾身。为人谋而不忠乎?与朋友交而不信乎?传不习乎?——《论语》
ETL是Extract、Transform、Loading三个字母的缩写,即抽取、转换、
()。
A:装载
B:预处理
C:清洗
D:升级
答案
2.HBase是一个构建在HDFS上的分布式列存储系统,用于海量结构化、半结
构化数据存储。()
A:错
B:对
答案:B
3.数据规约:在尽可能保持数据原貌的前提下,最大限度地精简数据量。主要
包括属性选择和数据抽样两种方法。()
A:对
B:错
答案:A
4.数据清洗是针对原始数据,对出现的噪声进行修复、平滑或者剔除。包括异
常值、缺失值、重复记录、错误记录等;同时过滤掉不用的数据,包括某些
行或某些列。()
A:对
B:错
答案:A
您可能关注的文档
最近下载
- 《GB_T 2659.1-2022世界各国和地区及其行政区划名称代码 第1部分:国家和地区代码》专题研究报告.pptx VIP
- 江苏省无锡市江南中学2023-2024学年九年级上学期期末语文试题[附答案].pdf VIP
- 项目临时使用林地难以避让乔木林地论证报告.docx
- 胰岛素皮下注射团体标准解读.pptx VIP
- 应用随机过程课件PPT课件.ppt VIP
- 一种天然气和布朗气混合燃烧方法及燃烧系统.pdf VIP
- 奕创飞ECF330S系列变频器使用说明书.pdf
- 交通信号灯施工方案.docx VIP
- 雅思考试(IELTS)真题.pdf VIP
- GB 50300-2013建筑工程施工质量验收统一标准.pdf VIP
原创力文档

文档评论(0)