第3章 实践SQL Server数据挖掘.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 实践SQL Server数据挖掘 创建数据挖掘项目 在SQL Server 2005的程序目录中打开 进入BI Dev Studio,在文件菜单中选择“新建”—“项目” 注意项目文件是保存在“我的文档”文件夹中的 新建项目对话框 打开解决方案资源管理器查看 MovieClick数据集 2002年11月,对微软的雇员进行调查。 调查询问了被调查者的电影观看行为、人口统计信爱所喜欢的电影、演员和导演。 内容包括 多久看一次电影 多久租一次影片 家里有多少台电视机 谁通常会选择您观看的电影 您最喜欢的电影 MovieClick数据集 2002年11月,对微软的雇员进行调查。 内容包括 您最喜欢的导演 您最喜欢的男演员和女演员 年龄 性别 婚姻状况 有几个小孩 您家里有多少张床 您拥有多少辆汽车 在ssms中创建数据库 1 在ssms中创建数据库 2 从外部文件导入数据 2 从外部文件导入数据 2 从外部文件导入数据 2 从外部文件导入数据 2 从外部文件导入数据 2 从外部文件导入数据 2 从外部文件导入数据 2 从外部文件导入数据 在解决方案中新建数据源 BI 新建数据源视图 为了使下一步顺利进行,在数据挖掘项目节点上单击右键选择“属性”进行设置 将部署中的目标服务器更改 创建MovieClick数据源 在SSMS中创建MovieClick数据库,导入数据表 在BI Dev Studio中创建项目MovieClick 在MovieClick项目中建立数据源 建立数据源视图:本例的要点是建立数据源中多张表之间的嵌套关系 如果一个事例表和一个嵌套表之间的关系不存在于关系数据库中,则必须在DSV中指定该关系,否则将无法将嵌套表添加到模型中 大家可以尝试在SSMS的相应数据库中通过建立数据库关系图来建立表之间的关系 MovieClick数据源视图 使用DSV来浏览数据 使用命名计算 在DSV中可以创建命名计算、命名查询和视图,这些操作并不会影响到原数据库中的数据 在DSV中,命名计算列是表中附加的虚列,所以可以在自己的数据中挖掘派生信息,而不需要改变源数据 命名计算列包含一个名称、一个包含计算的SQL表达式和一个可选的描述 使用命名计算 1 算术操作 可以使用+,-,*,/和%(求模)。例如创建利润列 [Sales Price]-[Item Cost] 2 数学函数 例:以对数的方法来规范化一个以指数级别增长的列 Log([Sales Quantity]) 创建一个标志,判断实际值高于还是低于季度预算 Sign([Actual Expenses]-[Budgeted Expenses]) 使用命名计算 3 组合表达式 将婚姻状况和是否有孩子的属性进行组合 [Marital Status]+ +[Has Children] 4 CASE表达式 CASE表达式可以创建有意义的变量,可以达到如下的目的: 改变值的标签 手动离散化列 减少有效状态的个数 将一个属性从一个嵌套表中转换为一个事例级属性 使用命名计算 4 CASE表达式 改变值的标签 CASE [Category] When 1 then food When 2 then Beverage When 3 then goods END CASE 使用命名计算 4 CASE表达式 手动离散化列: CASE When [Age]20 then Under 20 When [Age]=30 then Berween 20 and 30 When [Age]=40 then Between 30 and 40 ELSE Over 40 END 使用命名计算 4 CASE表达式 减少有效状态的个数 CASE [Marital Status] When Married then Marital Status When Never Married then Marital Status ELSE Other END 使用命名计算 4 CASE表达式 将一个属性从一个嵌套表转换到事例表: CASE When Exists (Select [Movie] From [Movies] Where [Movie]=Star Wars And Movies.CustomerID=Customers.CustomerID ) then True ELSE False END 在Customers表上创建一个命名计算 下面创建一个命名计算离散化并减少Num Bedrooms列中的状态。 在DSV中右击Customers表,选择

文档评论(0)

***** + 关注
实名认证
文档贡献者

本账号下所有文档分享可拿50%收益 欢迎分享

1亿VIP精品文档

相关文档