SQL Server 2005 Data Mining简介.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SQL Server 2005 Data Mining简介[转] 简介 企业均在尝试分析其数据时都面临若干问题。通常,并不缺乏数据。事实上,很多企业感觉到他们被数据淹没了;他们没有办法完全利用所有的数据,将其变成信息。为了处理这方面的问题,开发了数据仓库技术,以让企业从异构的数据源获取大量数据,并将其变成实用信息。 恰当实现的数据仓库是具有惊人强大功能的解决方案。公司可以对信息进行分析,并将其加以利用,以进行明智的决策。通过使用数据仓库,可以为您提供以下问题的答案: ?哪些产品最受 15-20 岁的女性欢迎? ?特定消费者的订单前置时间和按时交付的百分比与所有消费者的平均值相比如何? ?病房花在每个病人身上的成本和时间是多少? ?在签约阶段停滞时间超过十天的项目所占的百分比为多少? ?如果某个特定的实验室在某类特定的药品上投入了较多的资金,临床试验结果是否显示病人健康状况好于其他实验室? 除了这些通常可通过使用分析应用程序得出答案的问题之外,数据仓库还支持各种数据交付格式。分析应用程序设计为供分析人员使用,分析人员会对数据进行细分,研究较低级别的细节。报告应用程序会创建书面报告或联机报告,这些报告供功能要求略低的用户使用,提供静态内容,或提供有限的深入挖掘功能。对于业务决策者而言,计分卡是非常强大的功能,可以提供公司关键性能指标的概况,使决策者知道其身处何处。 尽管数据仓库强大而适用,但其自身有一个局限:它实质上反映的是过去的情况。由于数据仓库经常在夜间或按周加载和处理,因此其表示一个时间快照。实时或近似实时的数据仓库可能实现,且会变得更常见,在最佳的情况下,其数据将仍然表示当前数据和历史数据。业务决策者和分析人员需要研究此数据,为了发现因果关系,数据仓库需要进行一定量的分析。 不是让人提出假设,然后据此去找相关数据,而是让数据仓库确定关系、预测未来时间、发现劣质数据,并允许采用以前从来不可能的方式对数据进行分析,这是不是更为有帮助呢?这可以通过使用数据挖掘而实现。通过使用数据挖掘,可以得出诸如以下这样的问题的答案: ?客户将购买什么产品?哪些产品将一起销售? ?公司如何预测哪些消费者可能会流失? ?市场状况如何,将会如何发展? ?企业如何对其网站使用模式进行最佳的分析? ?组织如何确定营销活动是否成功? ?企业如何防止劣质数据进入系统? ?什么是分析非结构化数据(如无格式文本)的最好技术? Microsoft 在 Microsoft? SQL Server? 2005 中引入了大量新的数据挖掘功能,允许企业给出这些问题和其他问题的答案。本文将详细讨论数据挖掘可以解决的各种问题,并介绍 SQL Server 2005 处理这些问题的方式。本文中包括对典型数据挖掘问题的概述,并对 SQL Server 2005 中可用于解决这些问题的工具和模型进行了介绍。 数据挖掘的承诺 数据挖掘承诺将使企业决策者和分析人员更为轻松。除了仅预测未来性能外,数据挖掘将帮助标识数据中可能会被忽略的关系,根据各种环境计算特定产品售出的几率或特定消费者可能到别处进行购买的几率,诸如此类。 Microsoft 数据挖掘工具不仅仅提供传统数据挖掘功能。以前的数据挖掘功能对数据进行分析,寻找各个元素间以前未知的关系,是典型的“运行后即完成”过程。换句话说,公司运行数据挖掘工具,然后就查看结果。Microsoft 数据挖掘工具不仅仅是完成特定作业的工具,它们还将执行其相关工作,并立即反过来将结果应用到过程中。这意味着数据挖掘模型可能根据特定的标准对消费者进行分组,而分析人员随后就能立即根据这些新的客户分组情况细分数据。 将数据挖掘模型的结果立即提供到分析过程的这个能力表示组织现在可以立即确定如何最佳地对数据进行分析。目前,大部分组织都按照地域对消费者进行划分,仅包括有限的类似于人口统计的信息,如收入或教育程度等。数据挖掘可能会认为特定的消费者划分方式比任何地理界定更为有意义,例如,喜欢经典音乐和玩拖拉机游戏的高收入人群可能更喜欢特定的产品,而不会受其教育程度或地域的影响。一旦建立这个消费群后,就可以在分析阶段使用其对数据进行分析。使用不甚明显的分组方式分析数据是数据挖掘的最大好处之一。 可以使用数据挖掘模型的输出对数据进行分析,这是一个非常强大的功能,但也可以在集成阶段使用这些数据。换句话说,在组织将来自整个企业的数据进行合并的过程中,数据挖掘可以根据其他数据确定数据是否有意义。可以在商业智能项目集成期间发现不规则数据,而这意味着所得到的数据仓库更为清楚,对其进行分析将会更加准确和有意义。 数据收集应用程序进一步扩展了数据挖掘,可以应用用于在数据源消除劣质数据的规则。

文档评论(0)

精华文档888 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档