2016数据仓库实例.pptx

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2016数据仓库实例

数据仓库应用实现 计算机 王莹1.实现工具本例采用的是SQl Server2005所提供的商业智能服务和工具,主要包括Analysis Services(分析服务),Integration Services(集成服务),Reporting Services(集成服务)和Bussiness Intelligence Developer Studio(BIDS)。1.实现工具(续)分析服务(Analysis Services)SQL Server 分析服务(SSAS)是一个用于分析数据仓库中数据的工具,它包括了OLAP和数据挖掘工具。在SQL Server 2005数据库系统中,Analysis Services工具以服务器的方式为用户提供管理多维数据立方体的服务。Analysis Services可以把数据仓库中的数据组织起来,经过预先的聚集运算,加入到多维立方体中(即建立立方体),然后对复杂的分析型访问做出迅速的回答。1.实现工具(续)集成服务(Integration Services)SQL Server 集成服务(SSIS)被定位成一个能生成高性能数据集成解决方案(包括数据仓库中数据的提取、转换和加载(ETL))的平台。其集成的含义主要就是指把ETL集成在一起。SSIS通过一个统一的环境向用户提供了数据转换服务(DTS)所能提供的所有功能,并且大大减少了用户花在编写程序和脚本上的精力和时间。SSIS的基本功能包括: 合并来自异类数据源中的数据 填充数据仓库和数据集市 整理数据和将数据标准化 精确和模糊的查找功能 将商业智能置入数据转换过程 使管理功能和数据加载自动化1.实现工具(续)报表服务(Reporting Services)SQL Server报表服务(SSRS)是一个完整的、基于服务器的平台,它可以建立、管理、发布传统的、基于纸张的报表或者交互的基于Web的报表。SSRS提供的主要功能有: 为各类客户,跨企业提供并发访问功能 为各类提供数据源支持 针对个人和企业提供提供不同的数据报表分发机制 生成各类形式的报表 可生成多维数据报表,在此基础上可以进一步完成数据分析 工作,是真正的企业级报表生成工具。 1.实现工具(续)Bussiness Intelligence Developer StudioBIDS是SQL Server 2005新增加的一个开发环境,主要用于商业智能解决方案的开发。BIDS将开发商业智能所涉及的各个方面(例如数据转换和抽取、基于多维数据集的联机分析、数据挖掘和生成数据报表等)都集成在了一个开发平台上,也就是说商业智能开发人员可以使用BIDS开发出完整的商业智能解决方案。BIDS是一个基于Visual Studio 2005的开发平台,与Visual Studio 2005具有相同的设计界面。二.数据仓库应用举例1.数据源概述本例以SQL Server 2005提供的AdventureWorks数据库作为商业智能解决方案的数据源。AdventureWorks数据库是SQl Server 2005的范例数据库,它是一个大型的跨国自行车制造企业应用的业务数据库,其用途是帮助企业对自行车的生产和销售进行管理。AdventureWorks数据库主要的应用方面有人力资源、产品管理、市场销售、采购和供应商管理、生产管理。AdventureWorks数据库是一个比较复杂的数据库,可以使用Microsoft SQL Server Management Studio打开这个数据库,并查看其中的表格和字段。二.数据仓库应用举例(续)2.需求分析AdventureWorks数据库设计的方面很多,但是我们的目标很简单,只有以下三个:需要分析不同类别的产品通过直销在不同地区、不同时间段内销售的业绩。生成分析结果的报表。分析影响客户所有车的数量的因素。二.数据仓库应用举例(续)通过目标可以发现分析销售业绩基于的维度有三个:产品、客户和时间,事实数据则为反映销售业绩的订单。对于产品我们关心的是产品的名称和分类,由于产品和产品类别之间有一对多的关系,因此可以将这个维度设计为雪花模型。对于客户,我们主要需要关心客户的姓名、年龄、性别、婚姻状态、孩子的状况、是否拥有房产、拥有汽车的数量,所在的地区、国家、省和城市等信息。二.数据仓库应用举例(续)对于时间,我们只关心年、季度和月份,这些在数据库中不是显式存在的,但是可以从订单上的OrderDate字段中计算出来。对于事实数据,我们只会关心订单中产品的价格、折扣、数量和总价的情况。可以得到如下需求分析模型:二.数据仓库应用举例(续)分析模型的事实表、维度表关系二.数据仓库应用举例(续)3.数据转换和抽取(建立数据仓库)(1)首先使用Microsoft SQL Server Man

文档评论(0)

zhangdi1291 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档