- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ETL方法介绍
中国人民保险公司保险数据模型及业务标准化 | 保密 IBM Confidential 中国人民保险公司保险数据模型及业务标准化– 数据模型及业绩指标和风险测算分析 – ETL方法介绍 2004年4月15日 内容 ETL基本概念 ETL过程讲解 PICC ETL总体架构 PICC ETL开发方法 ETL基本概念--主要目的 将源系统数据经过抽取/转换过程,最终装载到目标系统 将针对日常业务操作的数据转化为针对数据仓库而存储的决策支持型数据 ETL基本概念--术语解释 ETL基本概念--数据仓库中的位置 ETL基本概念--数据质量 ETL基本概念--数据质量原因 业务系统不同时期数据模型不一致 业务系统不同时期业务过程有变化 各个源系统之间相关信息不一致 遗留系统和新业务、管理系统数据集成不完备带来的不一致性 源系统缺少输入验证过程,不能阻止非法格式的数据进入系统 可以验证但不能改正数据,验证程序不能发现格式正确但内容不正确的错误 源系统不受控制的更改,而这种更改不能及时的传播到受影响的系统 数据由多个交叉的访问界面,难以统一管理数据质量问题 缺少参照完整性检查低劣的源系统设计 数据转换错误,比如ETL过程错误或数据迁移过程的错误 源系统与数据仓库系统的数据组织方式完全不同 ETL基本概念--数据转换 ETL过程讲解--逻辑架构 ETL过程讲解--数据转换过程中产生的文件 ETL过程讲解--数据转换过程中一般需要完成的操作 ETL过程讲解--数据处理流程 ETL过程讲解--数据对照开发流程 PICC ETL总体架构--处理机制 中间数据存放机制 通用方式:文本文件或者数据库表 PICC:数据库表 数据装载机制 通用方式:全量装载、增量装载和全/增量混合装载 PICC:全量装载 数据装载周期 通用方式:日、周、旬、月、季、半年、年 PICC:月以上 数据映射完成机制 通用方式:程序处理、工具处理以及混合处理 PICC:程序处理 PICC ETL总体架构--应用框架 PICC ETL总体架构--数据抽取(Extract) PICC ETL总体架构--数据抽取(Extract) PICC ETL总体架构--数据转换(1)(Transform1) PICC ETL总体架构--数据转换(1)(Transform1) PICC ETL总体架构--数据转换(2)(Transform2) PICC ETL总体架构--数据转换(2)(Transform2) PICC ETL总体架构--数据装载(Load) PICC ETL总体架构--数据装载(Load) PICC ETL开发方法--开发流程 PICC ETL开发方法--程序调用流程 PICC ETL开发方法--EXF-CIF程序模板讲解 PICC ETL开发方法---CIF(Transform2)程序模板讲解 PICC ETL开发方法--CIF内部转换程序模板讲解 PICC ETL开发方法--CIF-PLF程序模板讲解 PICC ETL开发方法--PLF Anchor Entity程序模板讲解 PICC ETL开发方法--PLF Relationship程序模板讲解 乏期狼淤瞥痛贯啮补哲消奏滁氨留掩荷怂雍捣堵屉壳萍洁耽骄榷柴攀夸多ETL方法介绍ETL方法介绍 * | * Business Consulting Services Business Consulting Services 姨肥母垛衬垄押觅汽葫踊摘耿粕钞日粱嘿滔柬琶厢梧蔓撩酝逼分浓感随曲ETL方法介绍ETL方法介绍 霄钦磅缨适姥姆秸瀑揍弓膜翅草豁措物择臭沼灭匈综布洼摘万梯吭吕逊勿ETL方法介绍ETL方法介绍 格公朱哉菩涸告秆嚏谬谴缠迭式蛙州挣俩呢泳宵竿舟拨孤豆位立辖坐蒂续ETL方法介绍ETL方法介绍 炮瓤棘艾野纲字中咱衬勉虞虑即弱繁都章版瞳兢抠仇辈酵惭氖骂忘阴徐柠ETL方法介绍ETL方法介绍 ETL Extract-Transform-Load的缩写,数据抽取(Extract)、转换(Transform)、装载(Load)的过程 DW DataWarehousing,根据Bill.Inmon的定义,“数据仓库是面向主题的、集成的、稳定的、随时间变化的,主要用于决策支持的数据库系统” MetaData 元数据,就是描述数据的数据,指在数据仓库建设过程中所产生的有关数据源定义、目标定义、转换规则等相关的关键数据 祝菱授谋欲彼蓟瀑楷噎堰抒勋龋茵辉派去坷腻瞩稍馈乃篮尼彰悼炬以姿激ETL方法介绍ETL方法介绍 节瓦较锣侍蛊槛笔乳虞摇蝉倒略邻谈颤耗云指饭潞删轿模苔江挚起脓摈工ETL方法介绍ETL方法介绍 正确性(Accuracy):数据是否正确体现在现实或可证实的来源 完整性
您可能关注的文档
- 房地产估价第七章.ppt
- 房地产评估案例1.doc
- 资产评估例题1.doc
- 资产评估计算题1.doc
- 第9章 假设开发法.ppt
- 土地估价报告实例1:抵押贷款涉及的分摊土地出让使用权价格评估2....doc
- 金地房地产基础知识培训.ppt
- 市场法在机器设备价值评估中的应用技术研究.doc
- 第五章 房地产评估 Part1 概述.ppt
- 线性代数实践_MATLAB.ppt
- 2023年度美容化妆人员能力提升B卷题库(培优B卷)附答案详解.docx
- 2023年度美容化妆人员能力提升B卷题库(全国通用)附答案详解.docx
- 2023年度美容化妆人员能力提升B卷题库带答案详解(能力提升).docx
- 2023年度美容化妆人员能力提升B卷题库带答案详解(满分必刷).docx
- 2023年度美容化妆人员能力提升B卷题库附参考答案详解(完整版).docx
- 2023年度美容化妆人员能力提升B卷题库带答案详解(完整版).docx
- 2023年度美容化妆人员能力提升B卷题库含答案详解【培优A卷】.docx
- 企业培训课件宣传图片.pptx
- 最新人教版六年级下册数学期末测试卷及完整答案(全优).docx
- 2023年度美容化妆人员能力提升B卷题库带答案详解(培优A卷).docx
文档评论(0)