- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大数据之数据仓库面试题
姓名:__________考号:__________
题号
一
二
三
四
五
总分
评分
一、单选题(共10题)
1.数据仓库中的ETL过程,ETL分别代表什么?()
A.Extract,Transform,Load
B.Extract,Transfer,Load
C.Extract,Transform,Maintain
D.Extract,Transfer,Maintain
2.在数据仓库设计中,什么是事实表和维度表?()
A.事实表是存储业务数据的表,维度表是存储时间数据的表
B.事实表是存储时间数据的表,维度表是存储业务数据的表
C.事实表是存储业务数据的表,维度表也是存储业务数据的表
D.事实表是存储维度数据的表,维度表是存储业务数据的表
3.数据仓库中的数据粒度分为哪些级别?()
A.列级、行级、事务级、汇总级
B.列级、行级、事务级、文档级
C.列级、行级、汇总级、文档级
D.列级、行级、事务级、文档级
4.数据仓库中的OLAP和OLTP分别指什么?()
A.OLAP是OnlineAnalyticalProcessing,OLTP是OnlineTransactionProcessing
B.OLAP是OnlineLoadingAnalysis,OLTP是OnlineTransactionProcessing
C.OLAP是OfflineAnalyticalProcessing,OLTP是OnlineTransactionProcessing
D.OLAP是OnlineLoadingAnalysis,OLTP是OfflineTransactionProcessing
5.数据仓库中的雪花模型和星型模型有什么区别?()
A.雪花模型和星型模型在数据粒度上有所不同,雪花模型比星型模型更细粒度
B.雪花模型和星型模型在数据粒度上有所不同,星型模型比雪花模型更细粒度
C.雪花模型和星型模型在数据结构上有所不同,雪花模型比星型模型更复杂
D.雪花模型和星型模型在数据结构上有所不同,星型模型比雪花模型更复杂
6.数据仓库中的数据质量主要包括哪些方面?()
A.完整性、准确性、一致性、及时性、可用性
B.完整性、准确性、一致性、及时性、安全性
C.完整性、准确性、一致性、及时性、可靠性
D.完整性、准确性、一致性、及时性、稳定性
7.数据仓库中的数据抽取通常有哪些方法?()
A.实时抽取、定时抽取、增量抽取、全量抽取
B.实时抽取、定时抽取、增量抽取、全量抽取
C.实时抽取、定时抽取、全量抽取、抽样抽取
D.实时抽取、定时抽取、增量抽取、抽样抽取
8.数据仓库中的数据清洗主要解决哪些问题?()
A.数据缺失、数据异常、数据重复、数据不一致
B.数据缺失、数据异常、数据重复、数据过时
C.数据缺失、数据异常、数据重复、数据错误
D.数据缺失、数据异常、数据重复、数据延迟
9.数据仓库中的数据模型设计主要包括哪些内容?()
A.事实表设计、维度表设计、数据粒度设计、数据抽取设计
B.事实表设计、维度表设计、数据粒度设计、数据加载设计
C.事实表设计、维度表设计、数据粒度设计、数据清洗设计
D.事实表设计、维度表设计、数据粒度设计、数据转换设计
10.数据仓库中的数据挖掘主要应用哪些算法?()
A.决策树、神经网络、聚类算法、关联规则挖掘
B.决策树、神经网络、聚类算法、数据清洗算法
C.决策树、神经网络、关联规则挖掘、数据清洗算法
D.决策树、神经网络、数据清洗算法、关联规则挖掘
二、多选题(共5题)
11.以下哪些是数据仓库设计中常见的维度类型?()
A.时间维度
B.地理维度
C.产品维度
D.客户维度
E.组织维度
12.数据仓库中的ETL过程包括哪些步骤?()
A.数据抽取
B.数据清洗
C.数据转换
D.数据加载
E.数据查询
13.以下哪些因素会影响数据仓库的性能?()
A.数据模型设计
B.数据存储技术
C.数据索引策略
D.数据访问频率
E.数据源数据量
14.以下哪些是数据仓库的常见应用场景?()
A.商业智能
B.决策支持系统
C.客户关系管理
D.实时分析
E.财务分析
15.以下哪些是数据仓库数据质量评估的标准?()
A.完整性
B.准确性
C.一致性
D.及时性
E.可用性
三、填空题(共5题)
16.数据仓库中的ETL过程的第一步通常是__。
17.在数据仓库设计中,用于描述和分析业务数
您可能关注的文档
最近下载
- 气瓶充装许可证申请表(模板).doc VIP
- 《HJ707-2014-环境噪声监测技术结构传播固定设备室内噪声》.pdf VIP
- 莫同-云计算技术及应用-思考题答案-北大软微-2018秋季整理.pdf VIP
- 北京市保障性住房规划建筑设计指导性图集.docx VIP
- 安全监督与文明施工监理实施细则.doc VIP
- 《精品工程实施手册》装饰装修工程分册(可编辑).pptx VIP
- 反季节繁殖生产种鹅场的设计_陈哲.pdf VIP
- 2021 一级建造师考试水利-考前密训资料.docx VIP
- 2024年广东高职高考(3+证书)数学真题.docx VIP
- 选择性必修3文化交流与传播课后题答案 学思之窗、思考点、问题探究、学习拓展答案和教材注解 加页码新 简化版 加页眉.pdf VIP
原创力文档


文档评论(0)