SQL Server数据仓库与数据挖掘.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
8.1 SQL Server 2005的功能构架 SQL Server 2005的数据资源管理包括两大功能体系,一是关于数据库的管理,二是关于数据仓库的管理。 8.1 SQL Server 2005的功能构架 SQL Server 2005在数据仓库方面提供了三大服务和一个工具来实现系统的整合。 三大服务是 SQL Server 2005 Analysis Services(SSAS)、 SQL Server 2005 Integration Services(SSIS) SQL Server 2005 Reporting Services (SSRS), 一个工具是 Business Intelligence Development Studio。 8.1 SQL Server 2005的功能构架 8.1 SQL Server 2005的功能构架 SSIS能从各种异构数据源中整合数据到数据仓库中,这项功能在以前是通过DTS服务(即数据转换服务)来实现的。 SSAS是从数据中产生知识的关键,通过这种服务,可以构建数据立方(Cube),也就是多维数据集,然后进行OLAP分析,SSAS也提供数据挖掘的功能。 SSRS是报表设计工具,通过它可以对分析结果提供类型多样、美观且适合不同需求的图表和报表。 8.3 SQL?Server集成服务 8.3.1 SQL?Server集成服务的作用 在 SQL Server 2005 Integration Services (SSIS) 中,可以方便地创建解决方案,来执行提取、转换和加载数据 (ETL) 的处理。SSIS提供了设计、创建、部署和管理包的功能,用于处理日常的业务需求。 8.3.1 SQL?Server集成服务的作用 建立SSIS解决方案时,创建新的项目,该项目可以放在一般的方案管理之下,但它只是逻辑的管理单位,SSIS设计、新建、访问和执行的单位依然是包(Package),包可以理解为SSIS项目中基本的部署和执行单元。 8.3.2 控制流 SSIS包中的控制流由一组任务组成。 上图显示了一个简单的控制流示例。它以FTP任务开始,该FTP任务用于下载已压缩的数据文件。一旦下载完这些文件,运行时就会到达Foreach循环容器,在该容器内部有三个任务:执行进程任务(该任务调用unzip应用程序来解压缩数据文件)、大容量插入任务和检查数据库完整性任务。当解压缩完数据文件,数据文件中的数据被加载到SQL Server中并检查完数据库的完整性时,循环会停止。如果在循环期间发生了错误,则该控制流将执行发送邮件任务:向DBA发送电子邮件。如果正确地执行了每个任务,则该控制流将执行SQL任务,然后更新统计信息。 8.3.3 数据流 数据流是专门处理数据操作的工作流,也称为流水线。 在数据流中的每个节点都称为转换。数据流通常以源转换开始,以目标转换结束。 上图显示了一个数据流的示例。该数据流以OLE DB Source转换开始,该转换加载包含上市公司基本情况的事实表。第二个转换是“查找”,该转换从上市公司基本情况表中查找上市公司简称。这列数据被加入到流水线的数据中。下一个转换是“条件性拆分”,该转换将“ST公司”与“正常公司”分开。由于分析中ST公司与正常公司可比性不强,属于异常值,需要剔出,因此“ST公司”转换为Excel目标表保存即可,“正常公司”的相关数据则到达“派生列”转换,该转换根据流通A股中个人持股数量和总股本数计算“个人持股比例”,再经过“聚合”转换,按行业求算“平均个人持股比例”,最后转换为“SQL Server目标”为后期的数据挖掘做准备。值得注意的是,在创建包以及数据流之前,需要充分了解在源数据和目标数据中使用的格式。了解了这两种数据格式后,才能确定将源数据映射到目标数据所需的转换。 8.3.4 设计和使用ETL 数据仓库的设计是数据分析和数据挖掘的基础工作,良好的数据仓库结构设计是以后工作能顺利进行的保证。 数据仓库中的数据一般要从原始业务数据中获取,经过“提取-转换-加载”即ETL过程,对分析有帮助的数据将保存于数据仓库中。 Step1 单击“开始”菜单,选择“所有程序”,再指向 Microsoft SQL Server 2005,再单击 SQL Server Business Intelligence Development Studio。在 “文件”菜单上,选择“新建”,再单击“项目”。 Step2 在“新建项目”对话框中,从“项目类型”窗格中选择“商业智能项目”,再在“模板”窗格中选择“Integration Services项目”, 在“名称”框中,键入项目名称Stock_IS。 Step3 在“项目”菜单中选择“SSIS导入

文档评论(0)

6952225 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档