- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第PAGE页共NUMPAGES页
ETLELT开发BI工程师面试题集
一、选择题(每题2分,共10题)
考察方向:BI基础知识、ETLELT工具应用、数据仓库理论
1.在数据仓库建模中,星型模型的层数从内到外依次是?
A.事实表、维度表、聚集表
B.事实表、维度表、辅助表
C.事实表、维度表、桥接表
D.事实表、维度表、索引表
2.ETL工具中,用于数据清洗的常用操作不包括?
A.去重
B.空值填充
C.数据格式转换
D.逻辑判断与计算
3.以下哪种ETL组件主要用于数据抽取?
A.Transformer
B.Aggregator
C.Router
D.SourceAdapter
4.在数据建模中,雪花模型相比星型模型的主要缺点是?
A.维度表过多,查询效率低
B.事实表冗余度高
C.支持多级维度关联能力弱
D.数据更新复杂度低
5.BI报表中,以下哪种图表类型最适合展示时间序列趋势?
A.柱状图
B.饼图
C.折线图
D.散点图
6.ETL过程中,用于处理数据冲突的常用策略是?
A.直接覆盖
B.事务回滚
C.逻辑合并
D.手动干预
7.在PowerBI中,DAX语言主要用于?
A.数据抽取
B.数据转换
C.数据聚合
D.报表计算
8.数据仓库中,以下哪个概念描述了事实表与维度表的关系?
A.聚合
B.外键关联
C.分区
D.索引优化
9.ETL工具中,以下哪个组件负责数据加载到目标系统?
A.Filter
B.Sorter
C.Loader
D.Aggregator
10.在数据治理中,以下哪个流程不属于数据生命周期管理?
A.数据采集
B.数据存储
C.数据销毁
D.数据迁移
二、简答题(每题5分,共5题)
考察方向:数据仓库设计、ETL流程优化、BI报表开发
1.简述星型模型和雪花模型的主要区别,并说明在什么场景下适合使用星型模型。
2.在ETL过程中,如何确保数据抽取的完整性?请列举至少三种方法。
3.解释BI报表中“数据钻取”的概念,并说明其在业务分析中的作用。
4.在PowerBI中,如何实现动态筛选(Slicers)?请描述至少两种方法。
5.数据质量问题的常见类型有哪些?请列举三种并说明如何解决。
三、案例分析题(每题10分,共2题)
考察方向:实际业务场景解决能力、数据问题排查与优化
1.某电商平台需要开发一个BI报表,展示不同地区用户的购买行为趋势。数据源包括订单表(Order)、用户表(User)、商品表(Product)。请设计一个星型模型,并说明关键事实表和维度表的字段设计。
2.某公司使用ETL工具从多个业务系统抽取数据,发现目标数据仓库中存在大量重复数据。请分析可能的原因,并提出至少三种解决方案。
四、编程题(每题15分,共1题)
考察方向:SQL查询能力、DAX函数应用
使用以下数据表结构,编写SQL或DAX查询,实现以下需求:
-表1:Sales(销售表)
-Columns:SaleID,ProductID,CustomerID,SaleDate,Amount
-表2:Product(商品表)
-Columns:ProductID,ProductName,Category
需求:
1.查询2023年每个商品类别的总销售额。
2.使用DAX计算每个客户的购买频率(频次)。
答案与解析
一、选择题答案
1.B
-星型模型由事实表和维度表组成,无辅助表或桥接表。聚集表和索引表属于技术优化组件。
2.D
-逻辑判断与计算属于ETL的转换阶段,而非清洗操作。
3.D
-SourceAdapter用于连接数据源进行数据抽取,Transformer用于转换,Aggregator用于聚合。
4.A
-雪花模型将维度表进一步规范化,导致表数量增多,查询效率降低。
5.C
-折线图最适合展示时间序列数据。
6.C
-逻辑合并(如合并规则)是处理数据冲突的常用方法。
7.D
-DAX(DataAnalysisExpressions)用于报表计算和指标定义。
8.B
-外键关联是事实表和维度表的核心关系。
9.C
-Loader组件负责数据加载。
10.A
-数据采集属于数据采集阶段,数据生命周期管理包括存储、迁移、销毁等。
二、简答题答案
1.星型模型与雪花模型的区别:
-星型模型:维度表直接连接事实表,结构扁平,查询效率高,适合快速报表开发。
-雪花模型:维度表进一步规范化(如嵌套表),减少冗余但表数量多,查询复杂。
-适用场景:星型模型适合交易型业务(如电商、金融),雪花模型适合分析型业务(如市
您可能关注的文档
最近下载
- 2案例--新上任的分公司经理.docx VIP
- 《动画分镜设计》课件——第四章:镜头画面设计.pptx VIP
- 老年高血压特点及临床诊治流程专家共识(2024)解读PPT课件.pptx VIP
- xxx镇基干民兵快速集结预案.doc VIP
- 熔融盐理论与应用.pdf
- 2024水利闸门自动化系统技术规范.docx VIP
- 人教版英语七年级下册Unit 6 Rain or Shine单元分层作业.docx
- 【MOOC】《通信电子线路》(华中科技大学)章节作业中国大学慕课答案.docx
- 宣布干部任命后领导总结性讲话1400字.docx VIP
- Tengen天正TGW45系列万能式断路器TGW45说明书 2000 3200旋转排20230421用户手册.pdf
原创力文档


文档评论(0)