- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第PAGE页共NUMPAGES页
工程师求职bi备技能测试及参考答案集
一、单选题(每题2分,共10题)
背景:题目涉及数据仓库建模、ETL工具使用、SQL查询优化及BI报表设计等常见场景,针对互联网、金融、制造业等行业需求。
1.数据仓库建模中,星型模式相比雪花模式的主要优势是?
A.数据冗余度低,查询效率高
B.维度表独立,扩展性好
C.事实表关联复杂,易于维护
D.适用于小型数据集
2.使用InformaticaPowerCenter抽取数据时,以下哪项是影响抽取性能的关键因素?
A.目标数据库的索引配置
B.源表分区数量
C.映射逻辑的复杂性
D.以上都是
3.SQL查询中,以下哪个语句最适合用于实现数据去重?
A.`GROUPBY`
B.`DISTINCT`
C.`JOIN`
D.`HAVING`
4.Tableau中,以下哪种图表类型最适合展示时间序列趋势?
A.热力图
B.散点图
C.折线图
D.饼图
5.PowerBI中,DAX语言的核心用途是?
A.数据清洗
B.逻辑计算
C.ETL转换
D.数据可视化
二、多选题(每题3分,共5题)
背景:考察对ETL工具、数据质量治理、BI平台配置等综合能力的掌握。
6.ETL流程中,数据清洗的常见任务包括?
A.缺失值处理
B.异常值检测
C.数据类型转换
D.唯一性校验
7.数据仓库中,影响数据一致性的主要因素有?
A.事实表更新逻辑
B.维度表同步机制
C.ETL调度策略
D.业务规则变更
8.QlikView中,以下哪些组件属于数据加载脚本的核心元素?
A.父-child关联
B.SQL查询嵌入
C.参数化加载
D.数据聚合函数
9.数据质量治理中,以下哪些指标属于完整性范畴?
A.字段空值率
B.重复记录数
C.值域准确性
D.基准数据校验
10.BI报表开发中,以下哪些场景需要使用动态参数?
A.按地区筛选数据
B.实时更新指标
C.用户自定义分段
D.历史数据对比
三、简答题(每题5分,共4题)
背景:考察对行业知识、技术选型、问题解决能力的理解。
11.简述数据仓库中“维度退化”的概念及其优缺点。
12.在PowerBI中,如何优化复杂报表的加载速度?列举至少三种方法。
13.某银行需要分析用户交易数据,设计一个星型模式的简化方案(包含事实表和核心维度表)。
14.描述ETL过程中,如何通过日志记录和监控机制保障数据传输的可靠性。
四、论述题(每题10分,共2题)
背景:考察对技术实践的深度理解和业务结合能力。
15.结合金融行业场景,论述数据治理对风险监控的重要性,并提出具体实施建议。
16.对比Informatica和Talend两大ETL工具的优劣势,并说明在制造业数据集成项目中如何选择合适工具。
参考答案及解析
一、单选题
1.A
解析:星型模式通过中心事实表和独立维度表减少冗余,提高查询效率,适合大数据场景。雪花模式维度表嵌套,扩展性好但查询复杂。
2.D
解析:抽取性能受源表分区、映射逻辑、目标库性能等多因素影响,需综合优化。
3.B
解析:`DISTINCT`用于去除重复行,`GROUPBY`聚合数据,`JOIN`关联表,`HAVING`过滤聚合结果。
4.C
解析:折线图直观展示时间趋势,热力图适合密度分析,散点图用于相关性分析。
5.B
解析:DAX(DataAnalysisExpressions)是PowerBI的核心计算语言,用于构建度量值和计算列。
二、多选题
6.A、B、C、D
解析:数据清洗需处理缺失值、异常值、类型不一致及重复数据等问题。
7.A、B、C
解析:事实表更新逻辑、维度同步机制、ETL调度策略直接影响数据一致性。
8.A、B、C
解析:QlikView加载脚本支持父-child关联、SQL嵌入和参数化,聚合函数在应用层实现。
9.A、B、C
解析:完整性关注字段空值、重复记录及值域合理性,基准校验属于准确性范畴。
10.A、C
解析:动态参数用于用户筛选和自定义分段,实时更新和对比需依赖其他技术手段。
三、简答题
11.维度退化
答:维度退化是指将低层次维度属性直接嵌入事实表中,以简化关联逻辑。
优点:减少维度表数量,提升查询效率。
缺点:数据冗余度高,扩展性差,影响数据一致性。
12.PowerBI报表优化方法
-启用数据分区加载
-使用增量刷新替代全量刷新
-减少交叉筛选和复杂计算
13.星型模式设计
事实表:`交易事实`(交易ID、金额、时间、商户ID等)
维度表:`用户维度`(用户ID、姓名、年龄、地区)、`商户维度`(商户ID
您可能关注的文档
最近下载
- 码头港口仓储部业务培训教材.ppt VIP
- 17《昆明的雨》课件(共21张PPT)(内嵌音频+视频).pptx VIP
- 2004浙S2 钢筋混凝土化粪池.docx VIP
- 完整版《“十五五”规划建议》全文解读PPT.pptx
- DB13(J)T 8060-2019 城镇供热管道及设备安装工程施工质量验收标准.docx VIP
- 人教版高中数学精讲精练必修二101 随机事件与概率(精练)(原卷版).pdf VIP
- SYT6391-2014 SEG D Rev3.0地震数据记录格式.pdf VIP
- 石楼南煤层气勘查实施方案.docx VIP
- 人教版高中数学精讲精练必修一1.2 集合间的关系(精讲)(解析版).pdf VIP
- IPV4和IPV6地址.ppt VIP
原创力文档


文档评论(0)