- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘教程
塞思保罗
杰米 麦克伦南
唐昭辉
斯科特 欧俉桑
摘要:微软的SQL Server ? 2005年提供了一个综合完整的环境,用于创建和从事数据挖掘模型工作。本教程使用如下四个实例:目标邮购,数据预测,购物篮,序列簇用来演示阐述如何使用挖掘模型算法,挖掘模型浏览器,和数据挖掘工具,这些是包含在本次发布的SQL Server中。
在本文件所载的信息,代表了当前微软公司对于出版日期的讨论的看法。因为Microsoft必须响应不断变化的市场条件,它不应被解释为是一种代表微软的承诺,微软和Microsoft不能保证出版日期后提出的任何资料的准确性。
本白皮书仅供参考,对于本文件中的资讯,Microsoft不作任何担保,明示或暗指。
遵守所有适用的版权法是用户的责任。在没有版权的情况下,未经微软公司明确的书面许可,不得以任何形式或以任何方式(电子,机械,影印,录音或其他方式)或为任何目的而复制,储存或引入检索系统,或传输本文件任何一部分。
本文件中可能涉及到微软的专利,专利申请,商标,版权或其他知识产权事项。除明文规定外的任何书面许可协议,微软提供的这份文件没有给你任何许可这些专利,商标,版权或其他知识产权。
@ 2003年微软公司。保留所有权利。
微软既是一个注册商标又是微软公司在美国和/或其他国家的商标。
文中提到的公司和产品的名字可能是它们各自所有者的商标。
介绍
数据挖掘教程的目的是引导您通过微软SQL Server 2005创建数据挖掘模型 。该数据挖掘算法和工具,在SQL Server 2005可以很容易地建立一个全面的解决方案的各种项目,包括购物篮分析,预测分析,和邮购分析。对这些解决方案的描述在教程中有更详细的解释。
SQL Server 2005最明显的部分是用来创建和处理数据挖掘模型的工作室。在线分析处理( OLAP )和数据挖掘工具被统一为两个工作环境:商业智能开发工作室和SQL Server 管理工作室。通过商业智能开发工作室,您可以在与服务器断开连接的情况下建立一个服务项目分析。当项目已经准备就绪,您可以发布到服务器上。您也可以直接面向服务器工作。SQL Server 管理工作室的主要职能是管理服务器。之后将有针对每一个环境的详细说明。欲了解更多关于从两个环境中选择的信息,请参看SQL Server联机丛书中的“在SQL Server 工作室和商业智能开发工作室中选择”。
所有的数据挖掘工具中存在的数据挖掘编辑器。使用编辑器,您可以管理挖掘模型,创造新的模式,以期车型,比较模型,并建立预测的基础上现有的模式。
当您建立一个挖掘模型后,你会想要探索它,寻找有趣的模式和规则。编辑器中每个挖掘模型视图都被定制为由具体算法创建的探索模型。欲了解更多关于视图的信息,请参看SQL Server联机丛书中的“查看数据挖掘模型”。
您的项目往往会包含多个挖掘模型,所以才能使用的模式创建的预测,你要能够确定哪些模式是最准确的。出于这个原因,编辑包含一个模型比较工具挖掘精度的图表标签。使用此工具,您可以比较准确的预测模型和您确定最佳模式。
为了建立数据预期,你将使用一种 DME语言,DMX扩展了传统的SQL语法,包含了一些创建修改和建立数据预期的命令,关于DMX的详细信息,请参考SQL BOL中的 “Data Mining Extensions (DMX) Reference”章节。因为建立一个数据预期可能比较复杂,所以数据挖掘编辑器包含了一个工具叫做 “Prediction Query Builder”, 该工具可以让你在一个图形化的界面下编辑DMX查询语句,你也可以在该工具中可以查看自动生成的DMX语句。
了解了前面介绍的实现数据挖掘的工具之外,同等重要的是了解数据挖掘模型的结构本身,建立一个数据模型的关键是数据挖掘算法,该算法在你操作的数据中寻找我们需要的部分,并且转换这些数据成为一个可操作的数据模型,SQL2005 包含9中数据模型算法:
决策树
簇
传统贝叶斯
序列簇
时间系
联结
神经网络
线性回归
逻辑回归
组合的使用这9种数据算法,你能够创建适应大部分商业逻辑的数据挖掘解决方案,本教程将详细的介绍这些算法。
一些很重要的建立数据挖掘解决方案的步骤是用来整理准备那些用于建立数据模型的数据,SQL2005包含一个DTS的工作环境以及一些DTS的工具用于清理验证准备数据,关于DTS的更多信息请查看SQL BOL中的DTS Data Mining Tasks and Transformations章节。
为了阐述SQL2005中的数据挖掘特性,本教程使用了一个新的示例数据库AdventureWorksDW ,该数据库包含在 SQL2005中它提供OLAP以及数据挖掘的一些实例数据。为了使用这个数据库你需
您可能关注的文档
- 大吨位电动葫芦单梁门式起重机外文翻译 (2).doc
- 大学科目名称的英语翻译(全).doc
- 大学宿舍管理系统Web版毕业设计外文文献及翻译.docx
- 外文翻译税收筹划(适用于毕业论文外文翻译+中英文对照).doc
- 外文翻译倒立摆原稿[终稿].doc
- 外文资料翻译 (2).doc
- 外汇储备的风险管理战略分析框架【外文翻译】.doc
- 外文翻译叉车提升系统的创新设计.docx
- 大数据和云计算技术研究外文文献翻译2017.doc
- 外文资料原文和翻译.docx
- 2025年湖北省武汉市单招职业倾向性测试题库必考题.docx
- 2025年河南省许昌市单招职业适应性测试题库推荐.docx
- 2025年陕西航天职工大学单招职业技能测试题库汇编.docx
- 2025年浙江经济职业技术学院单招职业技能测试题库参考答案.docx
- 2025年浙江理工大学单招职业技能测试题库及参考答案1套.docx
- 2025年河北省邢台市单招职业适应性测试题库完整版.docx
- 2025年河南中医药大学单招职业技能测试题库审定版.docx
- 2025年浙江工贸职业技术学院单招职业技能测试题库完美版.docx
- 2025年湖南电子科技职业学院单招职业技能测试题库审定版.docx
- 2025年河北科技学院单招职业技能测试题库1套.docx
文档评论(0)