2025年数据质量考试试题及答案.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年数据质量考试试题及答案

一、单项选择题(每题2分,共20分)

1.以下哪项不属于数据质量六维模型(DAMA定义)的核心维度?

A.准确性(Accuracy)

B.完整性(Completeness)

C.可解释性(Interpretability)

D.一致性(Consistency)

2.某电商平台用户表中,出生日期字段存在2025-02-30这样的记录,该问题属于数据质量中的:

A.唯一性问题

B.有效性问题

C.及时性问题

D.一致性问题

3.数据清洗过程中,针对某患者年龄字段值为-5的异常值,最合理的处理方式是:

A.直接删除该记录

B.用字段平均值填充

C.联系业务部门核实原始数据

D.标记为缺失值后忽略

4.主数据管理(MDM)中,客户主数据的核心作用是:

A.确保客户数据在各系统中的实时同步

B.提供唯一、权威的客户标识和属性定义

C.替代各业务系统的客户数据存储

D.优化客户数据的查询性能

5.以下哪种场景最需要关注数据的及时性(Timeliness)?

A.银行年报数据的审计

B.实时风控系统的交易数据

C.企业历史销售数据的BI分析

D.政府统计年鉴的人口数据

6.数据质量规则引擎中,手机号必须符合11位数字且以13/15/17/18/19开头属于:

A.格式校验规则

B.值域校验规则

C.逻辑关联规则

D.唯一性校验规则

7.某医院信息系统中,同一患者在门诊、住院、检验系统中的患者ID不一致,该问题的根本原因最可能是:

A.各系统数据录入时间不同

B.缺乏统一的主数据管理机制

C.数据传输过程中发生丢包

D.业务部门对患者信息的定义不同

8.数据质量评估中,客户姓名为空的记录数占总记录数的比例衡量的是:

A.完整性

B.准确性

C.一致性

D.唯一性

9.以下关于数据血缘(DataLineage)的描述,错误的是:

A.用于追踪数据从产生到归档的全生命周期路径

B.仅适用于结构化数据,对非结构化数据无效

C.有助于定位数据质量问题的源头

D.是数据治理合规性审计的重要依据

10.在金融行业数据质量管控中,反洗钱交易数据需保留至少5年且不可篡改主要体现了对数据质量哪个维度的要求?

A.可用性(Usability)

B.耐久性(Persistence)

C.合规性(Compliance)

D.可追溯性(Traceability)

二、判断题(每题1分,共10分)

1.数据质量问题仅由技术系统缺陷导致,与业务流程无关。()

2.缺失值必须通过填充处理,否则会导致数据完全不可用。()

3.数据一致性仅指同一字段在不同系统中的取值一致,与业务含义无关。()

4.主数据管理的核心是建立跨系统的统一数据标准和权威数据源。()

5.数据质量评估指标设计需结合业务需求,不同行业的关键指标可能存在差异。()

6.数据清洗等同于数据转换,只需通过ETL工具自动处理即可完成。()

7.数据及时性要求数据必须实时更新,延迟超过1秒即视为质量不达标。()

8.数据唯一性问题的典型表现是同一实体在同一数据集内出现重复记录。()

9.数据质量报告只需提供统计结果,无需分析问题根因和改进建议。()

10.AI驱动的数据质量工具可以完全替代人工审核,实现100%自动化管控。()

三、简答题(每题8分,共40分)

1.简述数据质量评估的主要流程,并说明每个阶段的关键输出物。

2.列举数据质量问题的常见根源(至少5类),并举例说明。

3.说明数据有效性(Validity)与准确性(Accuracy)的区别,分别举例说明。

4.某企业计划建立数据质量监控体系,需考虑哪些关键要素?请分点阐述。

5.数据血缘分析在数据质量管控中的具体应用场景有哪些?至少列举3个场景并说明。

四、案例分析题(20分)

背景:某连锁零售企业(以下简称X公司)近年扩张迅速,业务系统从2套增加至8套(包括ERP、CRM、POS、WMS、会员系统等),但近期频繁出现以下问题:

-会员系统显示某客户累计消费10万元,但ERP系统显示该客户累计消费8万元;

-POS系统中部分门店的商品条码字段存在690123456789(13位)8位)两种格式;

-会员系统中客户手机号字段有15%的记录为

文档评论(0)

yclsb001 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档