- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库 数据仓库做了什么? 是整合分散的数据源。 是数据的标准化。 是数据的整合(不同于数据加工)。 形成建立仓库模型的流程(而不是建立一个堆满数据的数据库)。 这样就建立了一个可扩展、易扩展的仓库处理流程。它的建设目标不可能通过一个阶段的开发完成,而应该根据银行管理决策的发展需要,不断扩充其应用功能。 集成/产品/服务结构 商业智能项目技术体系 商业智能产品系列 JB-DI介绍—概述 用于数据抽取转换集成加载的数据整合平台 跨平台运行,可在多种软硬件环境间进行数据交换 多数据库支持,完成不同数据库间的数据互通 支持多种字符集,可支持EBCDIC与 ASCII码间的转换 JB-DI开发背景 目的性 针对数据整合领域开发,研发具有很强的目的性。 实用性 结合实际项目开发,注重解决项目实施中的实际问题。 前瞻性 是青鸟数据整合及信息集成解决方案的一个组成部分。 完备性 经过大型项目的实际验证,完善的技术实现架构。 数据整合流程 JB-DI产品系列 数据整合处理关键环节 数据抽取 文件装载 数据转换 数据加载 质量检查 代码维护 数据整合流程—数据抽取 数据抽取的特点 数据抽取过程运行于源系统主机上。 屏蔽操作系统、数据库、字符码制的差异性,卸出的数据包对目标主机是一致的。 操作系统:AIX、HPUX、SCOUNIX、AS400、ES9000、WINDOWS 数据库:DB2、INFORMIX、ORACLE、SYBASE、SQLSERVER 字符码制:ASCII、EBCDIC 必须能够清洗源数据中的物理级错误,如乱码、非法字符等。 支持灵活的抽取策略,理论上只要是标准SQL的查询语言都应支持。 支持各种抽取模式(如全量抽取、动户抽取)之间的灵活转换。 源数据抽取文件需要有冗余的校验信息,用来为系统控制和监视需求提供记录数目和字节总数等。 抽取程序能够自动生成卸出数据的格式描述信息 支持多种方式的数据传输方式,包括FTP或其它传输工具。 数据整合流程—文件装载 文件装载的特点 文件装载是数据抽取的逆过程,它必须能支持多数据源的文件数据装载模式。 支持多种文件装载方式,如添加装载和清空装载 能够根据校验文件检查出文件抽取和传输中的错误。 当数据文件装载过程中出错时,将当前未装入记录记入日志,以备错误处理。 数据整合流程—数据转换(1) 数据转换的分析 数据转换是数据整合过程的核心环节 数据转换的目的是生成与目标系统一致的数据 数据转换包括数据整理、剔除、合并、清理、验证等功能 数据转换在三个层面上进行 数据表级:表拆分,表合并,多对多转换 记录级:记录拆分,记录合并,多对多转换 字段级:简单赋值、截取、合并、算术运算、逻辑运算、代码转换、阶值转换、 数据转换必须支持条件分支运算 数据转换过程应该将无效数据标识出来而不能轻易丢弃,以保证数据的完整性, 数据整合流程—数据转换(2) 数据转换设计的原则要求: 首先完成数据整理工作,保证数据格式的正确性。 尽早剥离掉数据仓库中不需要的数据(记录和/或字段)。 只有数据质量问题无法在源应用系统中修复的时候才采用数据清洗的方法。 采用参数化的设计方法,以便新的条件和规则增加时,只需要做最少的编程工作,通过配置参数表的方式来完成。 转换程序的设计采用模块化的设计方法,以便于数据仓库的后续阶段的共享。 数据整合流程—数据加载 数据加载的特点 数据加载完成转换后数据到目标数据库的加载 加载数据格式与目标数据应该完全一致。 数据加载的关键是加载模式 新增(APPEND) 替换(REPLACE) 修订(MODIFY) 可以支持部分字段的更新加载。 数据加载时目标系统必须是离线的。 数据整合流程—质量检查 质量检查的特点 数据质量检查用于检查数据整合数据的逻辑错误 质量检查的类型 空值(NULL) 匹配(MATCH) 范围(RANGE) 相等(EQUAL) 质量检查的报告方式 打印出错误记录—REPORT 统计错误记录数--STATISTIC 质量检查的出错类型 系统错误—SYSTEM 警告错误—WARNING 致命错误—FATAL 数据整合—实施方法论 JB-DI的技术特点 JB-DI的技术特点 高效性:多线索并行处理 易用性:脚本配置解释执行方式来完成 开放性:支持多种平台和数据库。 扩展性:配置文件格式采用CFG/INI标准规范。 灵活性:平台提供外部通用编程接口 JB-DI在数据整合中的作用 易用性:减轻编程的压力,加快数据整合程序的开发速度 高效性:内置的并行处理机制,可以充分利用机器性能缩短数据整合程序的运行时间 开放性:支持多种数据库运行环境的选择 灵活性:适应数据转换的复杂性 JBAI-REPORT以Excel文件定制企业报表格式,并生成企业报表
您可能关注的文档
最近下载
- 《我们班四岁了(第一课时)》课件.pptx VIP
- 银屑病关节炎早期识别与诊治专家共识解读.docx VIP
- 人教版四年级上册数学期中试卷及答案.docx VIP
- 系统健壮性分析课件.pptx VIP
- Power Up教材配套测试PU2期末测试卷答案.pdf VIP
- 农村公路病害识别图、日常巡查保养记录表、群众性养护日常保养常见问题与处治方式汇总.pdf VIP
- 2019医用输液泵和医用注射泵安全管理.docx VIP
- 儿童医院“十五五”发展规划方案(2026-2030年).docx
- 护理不良事件-课件.pptx VIP
- 危险化学品建设项目变更情形及审查要求、适用简易程序的建设项目种类.docx VIP
原创力文档


文档评论(0)