SQLServer2005DataMining数据挖掘概览.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SQL Server 2005 Data Mining 简介 作者:Craig Utley 发布日期:2005 年 4 月 摘要:Microsoft SQL Server?2005 引入了大量新的数据挖掘功能。本文将详细讨论数据挖掘可以解决的各种问题,并介绍 SQL Server?2005 处理这些问题的方式。本文中包括对典型数据挖掘问题的概述,并对 SQL Server?2005 中可用于解决这些问题的工具和模型进行了介绍。Microsoft 非常荣幸地推出了多款数据挖掘工具,可在数据的整个生命周期(从集成到分析,再到报告)使用这些工具。现在可在任意阶段使用数据挖掘技术,而这为数据分析、应用程序开发、数据捕获和报告活动整个过程带来了新的机遇。 版权 本文为初步文档,在文中所述软件的最终商业版本发布之前,可能会有重大改变。 本文所含信息代表了 Microsoft 公司在本文发布时的观点。因为 Microsoft 必须顺应不断变化的市场条件,这些信息不应被视为 Microsoft 方面的承诺,同时 Microsoft 也不能保证本文发布之后其他任何信息的准确性。 本白皮书仅供参考。MICROSOFT 对本文档中的信息不提供任何形式的(包括明示或暗示的)保证。 用户有责任遵守所有适用的版权法。在版权法所赋予权利的前提下,未经 Microsoft Corporation 明确的书面许可,任何人不得将本文复制、存储或引入可检索系统,或是以任何形式或通过任何方式(电子、机械、影印、录制或其他方式)传播本文的任何部分。 本文主题可能涉及 Microsoft 的专利、专利申请、商标、版权或其他知识产权。除非获得 Microsoft Corporation 明确的书面许可,否则提供本文档并不代表许可您使用这些专利、商标、版权或其他知识产权。 2005 Microsoft Corporation。保留所有权利。 Microsoft、ActiveX、SharePoint、Visual Basic、Visual C#、Visual Studio、Windows、Windows Server 是 Microsoft Corporation 在美国和/或其他国家的注册商标或商标。 本文中提及的实际公司和产品的名称可能是其各自所有者的商标。 目录 简介 1 数据挖掘的承诺 2 SQL Server 2005 Data Mining 2 简介 2 创建智能应用程序 3 SQL Server 2005 数据挖掘功能的优势 3 易于使用 4 简单而丰富的 API 4 可伸缩性 5 SQL Server 2005 数据挖掘算法 6 可扩展性 6 SQL Server 2005 Data Mining 与端到端商业智能 7 数据集成 7 数据分析 7 报告 7 使用数据挖掘可以解决的问题 7 问题 1:消费者将购买什么产品?哪些产品会一起销售? 7 问题 2:标识将流失的消费者 8 问题 3:市场状况如何,将会如何发展? 8 问题 4:分析网站 8 问题 5:确定营销活动是否成功 9 问题 6:劣质数据 9 问题 7:文本分析 9 结束语 10 简介 企业均在尝试分析其数据时都面临若干问题。通常,并不缺乏数据。事实上,很多企业感觉到他们被数据淹没了;他们没有办法完全利用所有的数据,将其变成信息。为了处理这方面的问题,开发了数据仓库技术,以让企业从异构的数据源获取大量数据,并将其变成实用信息。 恰当实现的数据仓库是具有惊人强大功能的解决方案。公司可以对信息进行分析,并将其加以利用,以进行明智的决策。通过使用数据仓库,可以为您提供以下问题的答案: 哪些产品最受 15-20 岁的女性欢迎? 特定消费者的订单前置时间和按时交付的百分比与所有消费者的平均值相比如何? 病房花在每个病人身上的成本和时间是多少? 在签约阶段停滞时间超过十天的项目所占的百分比为多少? 如果某个特定的实验室在某类特定的药品上投入了较多的资金,临床试验结果是否显示病人健康状况好于其他实验室? 除了这些通常可通过使用分析应用程序得出答案的问题之外,数据仓库还支持各种数据交付格式。分析应用程序设计为供分析人员使用,分析人员会对数据进行细分,研究较低级别的细节。报告应用程序会创建书面报告或联机报告,这些报告供功能要求略低的用户使用,提供静态内容,或提供有限的深入挖掘功能。对于业务决策者而言,计分卡是非常强大的功能,可以提供公司关键性能指标的概况,使决策者知道其身处何处。 尽管数据仓库强大而适用,但其自身有一个局限:它实质上反映的是过去的情况。由于数据仓库经常在夜间或按周加载和处理,因此其表示一个时间快照。实时或近似实时的数据仓库可能实现,且会变得更常见,在最佳的情况下,其数据将仍然表示当前数据

文档评论(0)

80092355km + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档