基于SQL Server 2005数据挖掘系统优势分析.docVIP

基于SQL Server 2005数据挖掘系统优势分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SQL Server 2005数据挖掘系统优势分析

基于SQL Server 2005数据挖掘系统优势分析   [摘 要] 本文介绍了数据挖掘软件及工具的发展历史,提出基于SQL Server 2005的数据挖掘系统,阐述了SQL Server 2005平台的功能优势。   [关键词] SQL Server 2005;数据挖掘;数据仓库   [中图分类号]F270.7;TP311.13[文献标识码]A[文章编号]1673-0194(2008)14-0093-03      数据挖掘(Data Mining,DM))是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,是统计学、数据库技术和人工智能技术的综合。数据挖掘的工具和软件已广泛应用于银行金融、零售与批发、制造、保险、公共设施、政府、教育、远程通讯、软件开发、运输等领域。随着数据挖掘应用日渐广泛,人们发现有些工具只有精通数据挖掘算法的专家才能熟练使用,如果对算法不了解,难以得出好的模型,所以迫切需要一类使用简单而又具有针对性、功能良好的数据挖掘软件。因此,本文结合数据挖掘软件的发展,提出一种基于SQL Server 2005的纵向数据挖掘解决方案,并阐述了SQL Server 2005平台的功能优势。      1 数据挖掘软件及其开发工具的发展状况及趋势      1. 1数据挖掘软件的发展状况及趋势   在对数据挖掘技术和数据挖掘软件的探索和开发过程中,很多学者提出了自己独特的观点,Robert Grossman认为,数据挖掘软件的发展将经历4个时代[1]:   第一代数据挖掘软件。支持一个或少数几个数据挖掘算法,挖掘向量数据,数据一般一次性调进内存进行处理。如果数据足够大,并且频繁变化,这就需要利用数据库或者数据仓库技术进行管理,第一代系统显然不能满足需求。   第二代数据挖掘软件。与数据库管理系统集成、支持数据库和数据仓库,和它们具有高性能的接口具有高的可扩展性。 能够挖掘大数据集以及更复杂的数据集,通过支持数据挖掘模式和数据挖掘查询语言增加系统的灵活性。虽然注重模型的生成,但如何与预测模型系统集成导致了第三代数据挖掘系统的开发。   第三代数据挖掘软件。与预测模型系统之间能够无缝集成,使得由数据挖掘软件产生的模型的变化能够及时反映到预测模型系统中,由数据挖掘软件产生的预测模型能够自动地被操作型系统吸收,能够挖掘网络环境下的分布式和高度异质的数据,并且能够有效地和操作型系统集成,但是不能支持移动环境。   第四代数据挖掘软件。目前移动计算越发显得重要,将数据挖掘和移动计算相结合是当前的一个研究领域。第四代软件能够挖掘嵌入式系统、移动系统和普遍存在计算设备产生的各种类型的数据。   1. 2数据挖掘工具的发展状况及趋势   目前在整个数据挖掘技术的发展过程中,数据挖掘工具一共经历了3个阶段:   1. 2. 1独立的数据挖掘软件(1995年以前)   独立的数据挖掘软件对应第一代系统,出现在数据挖掘技术发展早期,研究人员开发出一种新型的数据挖掘算法,就形成一个软件。这类软件要求用户对具体的算法和数据挖掘技术有相当的了解,还要负责大量的数据预处理工作。   1. 2. 2横向的数据挖掘工具集(1995年开始)   随着数据挖掘应用的发展,人们逐渐认识到数据挖掘软件需要和以下3个方面紧密结合:数据库和数据仓库;多种类型的数据挖掘算法;数据清洗、转换等预处理工作。随着数据量的增加,需要利用数据库或者数据仓库技术进行管理,所以数据挖掘系统与数据库和数据仓库结合是自然的发展。现实领域的问题是多种多样的,一种或少数数据挖掘算法难以解决挖掘的数据通常不符合算法的要求,需要有数据清洗、转换等数据预处理的配合,才能得出有价值的模型。随着这些需求的出现,1995年左右软件开发商开始提供称之为“工具集”的数据挖掘软件。此类工具集的特点是提供多种数据挖掘算法,非面向特定的应用,是通用的算法集合,可以称为横向的数据挖掘工具。   1. 2. 3纵向的数据挖掘解决方案(1999年开始)   随着横向的数据挖掘工具的使用日渐广泛,人们发现这类工具只有精通数据挖掘算法的专家才能熟练使用,如果对算法不了解,难以得出好的模型。1999年开始,大量的数据挖掘工具研制者开始提供纵向的数据挖掘解决方案,即针对特定的应用提供完整的数据挖掘方案。对于纵向的解决方案,数据挖掘技术的应用多数还是为了解决某些特定的难题而嵌入在应用系统中。      2 基于SQL Server 2005的第三代数据挖掘系统构建      在分析了客户关系管理中的客户分类系统、客户流失预测系统等相关数据挖掘系统的基础上,本文提出了包括5个部分的基于SQL Serv

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档