数据挖掘实验指导..docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘实验指导.

实验五、数据挖掘 实验目的: 采用SQL Server 2005的数据挖掘工具,熟悉数据挖掘的关联、分类等分析方法 实验内容: 结合教材的数据挖掘知识,打开SQL Server 2005的数据挖掘教程,按教程步骤完成全部内容,约6学时,第1课1学时,第2课3学时,第3-5课2学时。 实验要求: 每次实验课结束前5分钟关闭SQL Server Business Intelligence Development Studio和SQL Server Management Studio,将项目文件夹拷贝到U盘或压缩后发到自己邮箱保存起来,以便下次实验课可以继续往下做。 每次实验课开始时先使用SQL Server Configuration Manager启动必需的SQL Server 服务。 实验说明: 按下图打开数据挖掘教程, 做的过程中,注意以下问题: 创建的项目放到一个方便找到的自定义文件夹中以便每次下课时可以拷贝带走 注意本教程开始的介绍【Microsoft 使用 SQL Server 2005 Analysis Services (SSAS) 可以很方便地创建复杂的数据挖掘解决方案。Analysis Services 工具提供了设计、创建和管理数据挖掘模型的功能,并且使客户端能够访问数据挖掘数据。】 第 1 课“准备 Analysis Services 数据库”中“创建数据源(数据挖掘教程)”部分,【在“服务器名称”列表中,选择承载 AdventureWorksDW 的服务器。输入您的凭据。例如,如果在本地服务器上承载数据库,则选择 localhost。】此处我们输入“服务器名称”为localhost\DWDM。 第 2 课“生成目标邮件方案”介绍中注意【若要完成本课程中的任务,您需要使用 Microsoft Naive Bayes 算法、Microsoft 决策树算法和 Microsoft 聚类分析算法。 】 第 2 课“生成目标邮件方案”中“创建目标邮件挖掘模型结构(数据挖掘教程)”的【在“选择定义方法”页上,确认已选中“从现有关系数据库或数据仓库”,再单击“下一步”。】步骤出现如下图所示对话框,注意数据挖掘可以基于关系数据库、数据仓库和多维数据集(即OLAP多维数据库) 第 2 课“生成目标邮件方案”中“创建目标邮件挖掘模型结构(数据挖掘教程)”的“部署项目并处理挖掘模型”部分,将【1.按 F5。Analysis Services 数据库将部署到服务器上,而挖掘模型也将得到处理。如果数据库已经部署到服务器上,则可使用下列过程,以便只处理挖掘模型。】改为【在解决方案管理器中的AdventureWorks项目上点右键,选择“属性”,如下图所示,设置“部署”中的“服务器”为localhost\DWDM。然后按 F5。Analysis Services 数据库将部署到服务器上,而挖掘模型也将得到处理。如果数据库已经部署到服务器上,则可使用下列过程,以便只处理挖掘模型。】 第 2 课“生成目标邮件方案”中“创建目标邮件挖掘模型结构(数据挖掘教程)”的“在项目已部署完成时处理挖掘模型”部分,将【在 BI Development Studio 的“挖掘模型”菜单上,单击“处理挖掘结构和所有模型”。】改为【在 BI Development Studio 的“挖掘模型”菜单上,单击“处理(P)…”。】 第 2 课“生成目标邮件方案”中“浏览目标邮件模型(数据挖掘教程)的“Microsoft 决策树模型”部分,先如下图所示选择挖掘模型为“TM_Decision_Tree” 第 2 课“生成目标邮件方案”中“浏览目标邮件模型(数据挖掘教程)的“Microsoft 聚类分析模型”部分,【例如,将“明暗度变量”设置为 Bike Buyer,将“状态”设置为 1。您会看到,分类 5 中自行车购买者的密度最高,分类 4 与分类 7 之间的关系最接近。】我们的结果与之不同 第 2 课“生成目标邮件方案”中“浏览目标邮件模型(数据挖掘教程)的“Microsoft 聚类分析模型”部分的“分类剖面图”最后一句【连续属性以菱形图显示,表示每个分类中的平均偏差和标准偏差。】改为【“连续属性以菱形图显示,表示每个分类中的最大值、最小值、平均值、平均值加标准差(即平均值加均方差,以“平均值+StdDev”表示)、平均值减标准差(以“平均值-StdDev”表示),菱形宽度与方差大小相关”】 第 2 课“生成目标邮件方案”中“浏览目标邮件模型(数据挖掘教程)的“Microsoft 聚类分析模型”部分的“分类辨别”即“分类对比” 第 2 课“生成目标邮件方案”中“创建预测(数据挖掘教程)”的“查看结果”部分,使用TM_Decision_Tree预测出来的

文档评论(0)

stzs + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档