DAT 337使用 SQL Server Integration Services 装载数据仓库.ppt

DAT 337使用 SQL Server Integration Services 装载数据仓库.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DAT 337 使用 SQL Server Integration Services 装载数据仓库 吕科 技术咨询顾问 上海星移软件有限公司 商业智能的平台 Integration Services 简介 新的 SQL Server 商业智能应用程序 DTS的升级版本 新一代的高性能数据整合平台 SSIS 能做什么? 聚合和排序 数据转换的重要操作 在数据流中支持多种聚合函数 Group By, Sum, Count Distinct 等 在数据流中排序 SSIS 支持真正的 ETL,不是 ELT 聚合性能甚至超过数据库 关联 清洗数据的重要操作 Lookup 较大的事实表和较小的维度表,如分类维度 Merge Join 较大的事实表和较大的维度表,如客户维度 适应新的数据仓库架构 适应新的数据仓库架构(续) 特殊的功能 时间维的生成 通过 Analysis Services 指定日期范围来生成纬度成员 Pivot 和 Unpivot 操作 更多的功能 演示 - UnPivot 数据清洗 Fuzzy lookup 模糊查找,找到最合适的匹配值 Fuzzy duplicates 模糊分组,例如 “Windows XP,” “WinXP,” 由微软中国研究院完成 数据挖掘 在 ETL 过程中使用挖掘模型 使用输入数据来训练挖掘模型 使用挖掘模型来处理数据 基于模式的 data quality 使用挖掘模型来预测背离值 在运行时根据数据来选择最佳算法 Analysis Services 设计时和运行时的集成 Analysis Services 作为数据目的 装载到 Analysis Services Analysis services 作为数据目的 一步到位,不需要中间存储 以往 二维数据 ? SQL Server ? AS SSIS 二维数据/XML/Web Service/… ? AS 对Analysis Services进一步的支持 Execute DDL task 就像执行 SQL 命令一样 建立多维数据集、分区等 共享的项目结构 一起管理 AS 和 ETL 项目(包括 RS 和 VS) 只需一次定义数据源信息 缓慢变化维 自动建立一类和二类缓慢变化维 Fixed Attribute 当改变是个错误 Changing Attribute 不记录历史的更改,如名称 Historical Attribute 记录历史痕迹的更改,如所属机构 会引发新增维度成员 Inferred member 迟到的维度数据 先装载事实数据 缓慢变化维(续) Business key 来自于源数据的key Surrogate key 可来自于其它字段 通常是自动增长 其他的改变 SQL Task – 可执行存储过程和其他 SQL 语句 可扩展性 可以编写自己的 SSIS 组件 可以在script任务中调用.NET 代码 可调用性 Web service XML .NET 可靠性和可恢复性 Error flows 在任务中处理错误数据 Event handling 在执行包时响应事件 Package restart 设置失败的检查点 操作 日志记录 丰富的logging providers,如:文本、数据库、XML、Windows event log 或自定义的 log provider 可以给单个或多个任务设置独立的日志 性能监视器 整个生命周期的支持 运行时设置属性和变量 可通过 XML, 注册表, 环境变量, SQL 进行配置 发布功能 总结 更快的速度! 以数据流的方式,能够高效的处理复杂的逻辑。 更强的功能! 新增的Data flow 增加的Task和Transformation 与其它微软BI产品的结合 真正的ETL! 在流程中清洗数据 微软SQL Server社区 microsoft.public.sqlserver.server .sqlserver 我的社区 /luke 中文 SQL Server 主页: /china/sql 下一个会议 DAT239:SQL Server 2005数据仓库新功能 其它英文资源 /SQL/sqlwarehouse/SSIS/default.aspx 问题 什么是SQL Server Integration Services? ETL和ELT相比有什么好处? 和Analysis Services的集成带来什么好处? 缓慢变化维有什么用处? 从源系统中抽取数据 将数据转换为更适合在 OLAP 系统中使用的格式 将数据装载到数据仓库或数据集市中 根据商业逻辑,对数据进行分析,以多维的形式展现数据 通过数据挖掘发现深层次的信息 数据展现和发布 报表的设计、管理和发布 Int

文档评论(0)

汪汪队 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档