- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于数据治理的企业数据质量管理与保障解决方案
1数据质量问题背景及分类2数据质量体系建设原则3数据质量方案框架及关键技术4数据质量行业实践整理制作:郎丰利1519制作时间:2023年睿利而行整理制作:郎丰利1519制作时间:2023年睿利而行整理制作:郎丰利1519制作时间:2023年睿利而行
1数据质量问题产生的背景2数据质量体系建设原则3数据质量方案框架及关键技术4数据质量行业实践整理制作:郎丰利1519制作时间:2023年睿利而行整理制作:郎丰利1519制作时间:2023年睿利而行整理制作:郎丰利1519制作时间:2023年睿利而行
数据质量管理体系的构成为建立全方位的数据质量管理体系,应同时关注组织、技术和流程三大核心部分,三部分相辅相成才能形成完整的数据质量管理体系。
数据质量体系建设五个原则目标提升数据质量问题解决效率,提升企业数据质量全程监控:从数据的定义、录入、存储、加工、交互、使用全过程进行数据质量监控,明确各部门在全过程中的责任,全方位保证数据质量主动管理:强化对企业发现的各IT系统数据质量问题的主动管理,协同相关部门推动问题的有效解决闭环管理:建立数据质量问题的发现、通报、整改和反馈等环节具体流程,形成数据质量问题的闭环管理自动管理:深入分析业务人员发现的数据质量问题的业务规则和成因,科技部门将其转化为技术规则落地到系统中,实现数据质量问题的自动筛选。全员参与:业务人员、技术人员和运维人员要共同参与数据质量提升工作。12345
全程监控—事前、事中、事后三阶段管理事前预防事中监控事后改善数据质量主动保证,侧重面向未来的数据(指业务运营过程中新增的数据),通过业务流程优化、源系统改造和数据标准规范来提升数据质量。未来数据数据质量持续监控与优化,侧重面向当前的数据(当前数据质量检查周期内更新的数据),根据数据质量检核规则,对数据进行持续、周期性监测。当前数据历史数据数据质量清洗提升,侧重面向历史数据(指某个时间点前已经生成的数据)。按业务系统或主题分批对数据质量分析、清洗,提高既有数据的质量。
从发现到改进闭环管理建立数据质量闭环管理机制、明确各部门关于数据质量提升工作的分工职责并强化执行;同时基于数据管理工具,固化流程,线上支撑企业级数据质量管理,确保企业级数据质量稳步提升。
固化流程、全员参与
借助工具、自动管理数据质量管理员技术人员业务人员问题定义问题发现/分析问题跟踪问题处理评估和统计数据质量问题需求提出,选择系统(检核对象业务实体、属性)需求转化检核规则,通过可配置化方式,自动生成检核脚本,批量检核问题数据。输入数据质量问题管理,疑似问题发布数据质量问题整改。采用问题认责方式,保证问题处理及时行。数据质量问题整改效果确认。未及时处理的问题,纳入考核计分数据质量问题评估与分析,图形化展示统计报表。1)检核维度报表2)机构问题统计报表。3)问题整改效果报表。4)问题分布报表。检核目标库输出企业级元数据管理流程自动化sql脚本引擎问题存储库数据质量问题分析。元数据模块提供影响分析,为下游问题预警
提升意识、主动管理因子项关联定义数据标准明确数据责任人开展数据质量宣贯提升数据质量意识
3数据质量方案框架及关键技术1数据质量问题背景及分类2数据质量体系建设原则4数据质量行业实践
功能架构应用功能层接口服务数据质量报告数据质量分析质量监控获层取角色管理日志管理权限管理用户管理参数管理ODS/EDW/hadoop方式一:检核结果文件方式二:直连数据库任务手工调度任务自动调度调度参数管理并发跑批设置度量规则定义度量规则类别度量规则管理检核方法管理检核脚本生成检核方法导入检核方法导出检核结果管理问题显示配置问题发布管理问题处理跟踪问题查询管理问题考核管理问题导入/导出消息管理通知人管理消息模板管理发送任务管理知识库管理知识分类管理知识内容管理知识库查询多维度数据质量报告数据质量报告导出数据质量汇总分析影响/血统/趋势分析重点问题监控问题整改监控检核结果接口检核方法接口
关键技术—检核脚本自动生成SQLEngine方式一:参数化配置空值检核01)基础类度量规则02)复杂业务度量规则非法值检核非法代码检核主键重复检核系统间一致性检核数据总数检核表间关系检核业务逻辑Sql存储过程定时调度方式二:模板导入按照度量规则类别,自动生成检核Sql语句。对业务逻辑复杂的检核方法,支持编写存储过程脚本对问题检核。问题跑批处理:1、支持与第三方调度工具的集成。2、产品自身提供跑批调度管理。业务人员通过系统界面进行规则定义或者通过模板导入方式进行,屏蔽技术细节。缩短度量规则转化为检核方法的时间。采用模板配置和页面参数配置方式输入检核规则,通过系统内置SQL引擎,实现检核脚
您可能关注的文档
- 海参产品购销合同.docx
- 高考物理大一轮复习-4.5-第5节-天体运动与人造卫星课.pptx
- 《基础会计学》(魏芳)-01项目一-认识企业和会计工作.ppt
- 电子课件-《英语(第一册)(第三版)》-A01-3820-英语-第一册-第三版-Unit7.pptx
- 排洪渠的工程施工方案设计.pptx
- 血透患者高钾血症护理查房课件.pptx
- 费用报销管理制度培训(共27张课件).pptx
- 高等无机化学课件--第二章--群论与分子的对称性.ppt
- 2023年中考英语复习专题课件★★-阅读理解.ppt
- 人教版八年级上册英语Unit7-10全部词汇详解课件.pptx
- 北师大版小学数学三年级上册《寄书》教学设计.docx
- 统编版(部编版)语文二年级上册《雪孩子》教学设计.docx
- 统编版(部编版)语文二年级上册《八角楼上》教学设计.docx
- 北师大版小学数学三年级上册《长方形周长》教学设计.docx
- 北师大版小学数学三年级上册《丰收了》教学设计.docx
- 统编版(部编版)语文二年级上册《夜宿山寺》教学设计.docx
- 统编版(部编版)语文二年级上册《风娃娃》教学设计.docx
- 统编版(部编版)语文二年级上册《朱德的扁担》教学设计.docx
- 统编版(部编版)语文二年级上册《难忘的泼水节》教学设计.docx
- 统编版(部编版)语文二年级上册《纸船和风筝》教学设计.docx
文档评论(0)