第五章SQLServer数据仓库.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章SQLServer数据仓库.ppt

第五章 SQL Server 数据仓库的应用 数据仓库产品 数据仓库产品:著名的数据仓库产品提供商有Oracle、IBM、Sybase、Informix、NCR、Microsoft、SAS、CA等; 这些产品大致可为三大类:单点产品、提供部分解决方案的产品、提供全面解决方案的产品 SQL Server 2000数据仓库工具 关系数据库:强大的、全功能的关系数据库引擎,并且使用关系数据库技术作为数据仓库实现的基础。 数据转换服务:数据转换服务DTS(Data Transformation Services)可以访问各种不同的数据源,提供数据输入/输出和自动调度功能,在数据传输过程中可以完成数据的验证、清洗和转换等操作。 SQL Server 2000数据仓库工具 数据库复制:通常用于分发数据和协调联机事务处理系统 (OLTP) 中分布式数据的更新,也可用于数据仓库。例如,将数据从中央数据仓库分发到数据集市,以及从数据准备区更新数据仓库数据等等。 Analysis Services:提供联机分析处理 (OLAP) 技术,用以组织大量的数据仓库数据供客户端工具进行快速分析,并提供先进的数据挖掘技术以分析和发现数据仓库数据内的信息。 SQL Server 2000数据仓库工具 English Query:提供用英语对数据仓库进行访问的机制。 Meta Data Services:提供用于查看这些元数据的浏览器,并提供用于开发自定义元数据应用程序的应用程序接口。 Analysis Service 本章主要讲述如何使用Analysis Service创建及使用数据仓库的方法和步骤。 Analysis Service的安装和启动 Analysis Service的安装和启动 连接数据源 建立多维数据集 建立数据库 建立数据源与ODBC数据源连接 建立多维数据集 (事实表、时间维度、产品维度、客户维度) 编辑多维数据集 设计存储和处理多维数据集 1.数据钻取的进入 2.数据钻取选项的确定 3.钻取数据列的选择 4.数据钻取角色的管理 5.钻取数据的选择 6.钻取结果显示 创建、使用数据挖掘模型 数据挖掘模型算法 按用户分 聚类(clustering) 决策树(decisiontree) 按算法意图分 分类模型(classfication models) 聚类模型(clustering models) 描述模型(descriptive models) 预测模型(predictive models) 分类模型 (classfication models) 分类模型是根据各种规格和属性对事例进行 分组。 聚类模型 (clustering models) 聚类模型是将所有相似特征的事例组合在一起。 描述模型 (descriptive models) 有时数据挖掘的目的是描述所查看的数据, 通过使用描述模型,分析者可以深入了解驱 动所观察到的行为的原因。 预测模型 (predictive models) 预测模型是用来识别那些最易于接受新产品 或促销的市场部分。 数据挖掘是如何工作的? 对情况进行评估 分析者收集与问题相关的信息,并将信息保存于一个固定的数据存储中 分析者选择可能提供答案的技术 选择一个算法,并加入样本数据执行该算法。 数据挖掘的周期 理解情况 创建模型 进行分析 采取行动 度量结果 重复 数据挖掘的周期 理解情况: 识别机会和提出问题的过程 数据挖掘的周期 选择并创建一个模型 根据找到的机会确定所需要的信息,考虑是 否已经有一个现成的包含所需要信息的数据 仓库,或者需要先收集需要信息才能够进行 分析。 数据挖掘的周期 进行分析 确定信息完整之后,使用完整的数据集来训练模型, 并在这个数据集上运行数据挖掘引擎。 数据挖掘的周期 采取行动 数据挖掘输出的结果被应用到实际中,并且行动的 结果作为度量阶段的输入。 数据挖掘的周期 度量结果 采取的行动是否正确,实际结果是否是预期的结果, 预期是否正确? 数据挖掘的周期 重复 观察新的情况,并重复以上过程。 数据挖掘的工具 决策树 聚类分析 为数据挖掘服务的OLE DB 第三方工具 决策树 决策树是一种分类形式,其中回答一系列的二叉或是/否问题,直到事例能够归到某个特定类别中。 决策树算法反复扫描数据,将它分裂成几个小组,从这些分组可以找到一组规则来描述数据。 这个过程持续到某个特定点,在这点上,根据现有的参数,再进一步的分组已经没有意义了。 聚类分析 通过将相似的对象组成一类来组织异构对象的过程为聚类。 这通常是一个无向的数据挖掘方法,有助于发现不同事例之间的联系 由于它对数据未做任何假设,所以它可以标明数据中的异常,从而有助于确定下一步的挖掘动作。

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档