数据仓库体系架构教案分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
湖南电信EDW体系架构 黄晓波 NCR (中国) 有限公司数据仓库事业部 议题 数据集市 vs 企业级数据仓库 EDW vs 集线器 辐条 企业级数据仓库的拓扑结构 EDW体系架构概要 建立数据仓库系统过程的首要环节 针对系统较高层次的描述与整体规划 满足业务需求对技术实现的要求 定义各模块的功能、设计原则与接口 数据仓库的可管理、可扩展与可访问 企业级数据仓库 Teradata数据仓库 – 数据源 Teradata数据仓库 – ETL工具 Teradata数据仓库 – ETL合作伙伴 Teradata数据仓库 – 数据库 Teradata数据仓库 – 数据库管理工具 Teradata数据仓库 – 硬件平台 Teradata数据仓库 – 数据挖掘工具 Teradata数据仓库 – OLAP Server Teradata数据仓库 – 商业智能工具 Teradata数据仓库 – WEB工具 Teradata数据仓库 – 用户 Teradata数据仓库体系结构示例 EDW 结构框架 议题 EDW体系架构设计原则 经典的数据仓库体系结构理论依据 合理的层次划分与模块接口 考虑系统的稳定性、安全性与可扩展性 持续的业务支持能力 必要的安全策略与控制 EDW体系架构要素 从不同的数据中心获取数据 需要清楚的定义数据接口和数据交换协议 确保数据被及时传送 数据质量 数据标准化确保从所有数据源得到的数据具有一致性含义 数据质量检查确保数据从无规则形态转变到标准化的形态。所有脏数据都被侦测并清除 数据错误的追踪和重新处理系统确保所有的错误被跟踪,校正和重新处理 数据潜伏期 ETL流程必须提供高性能并使生产能力最大化 数据可用性 确保数据安全可用; 安全,备份和恢复; 机器容量和性能 应归于大容量数据存储和高端配置 系统的可扩展性与可管理性 适应系统将来数据量和用户量的增长 性能管理和自动化数据仓库流程 确定体系架构的过程 议题 湖南电信事实 基于本地网的运营模式 源系统分散、多数据库平台并存 业务源数据量大且不断增长 潜在的数据质量问题 网络结构拓扑 业务系统改造与更新 数据仓库核心 ETL过程与管理体系 Teradata数据库 – PDM 数据仓库应用及多维分析 数据挖掘及应用服务 应用访问的统一门户 ETL逻辑体系结构 数据ETL 分布式结构 – 接口机 – 前置机 – 数据库 :任务与资源的平衡   接口机:从本地网各业务系统中抽取源数据,形成接口文件,大数据压缩      前置机:通过自动化ETL流程从接口机获取数据、解压缩、并按照ETL任务 定义进行数据加载,必要时作数据清洗和部分转换  数据库:根据SDM进行转换 ELT的总体加载策略 文件接口协议 - 数据文件与标志文件  多点采集、单点控制   考虑业务系统与数据操作安全 时间窗口与性能影响 性能影响分析 自动化流程控制 数据质量 DW Automation ETL作业调度 事件触发和时间触发 完善的日志 简单易用的监控和管理 快速实施,灵活高效 TWM逻辑体系结构 统计函数可作为 C++ APIs 统计 分析功能可作为 Microsoft COM 接口 公用的元数据模型  可用作评分与运用 运行在Windows 平台 (98, 2000 2003) 支持各种操作环境 (Windows或Unix)下的Teradata 前端应用逻辑体系结构 数据仓库管理 主机、存储硬件监控及管理 数据仓库运行管理与监控 数据仓库工作负载管理 备份与恢复 系统安全 管理工作站AWS 集中管理 单一的图形化操作界面 可管理 Cabinets Power Nodes BYNET Disk Storage Teradata Administrator Manage the database Perform typical database operations with a click of the mouse History of SQL operations Teradata Manager 为DBA操作命令和控制函数提供单一的接口 动态性能分析工具 一个DBA可以访问多个Teradata系统 丰富的工具集 Teradata Manager - Teradata Dashboard Teradata Manager - Workload Analysis 管理混合的工作负载 TDQM 自动管理Teradata工作负载 为Teradata提供查询管理的机制,确保正确的时间 完成正确的工作 TDQM评估提交的请求并能够: 实时运行任务 延期运行任务 定时运行任

文档评论(0)

我是兰花草 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档