数据仓库和数据挖掘实验三(数据挖掘).docVIP

数据仓库和数据挖掘实验三(数据挖掘).doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库和数据挖掘实验三(数据挖掘).doc

一、实验内容和目的 目的: 1.理解数据挖掘的基本概念及其过程; 2.理解数据挖掘与数据仓库、OLAP之间的关系 3.理解基本的数据挖掘技术与方法的工作原理与过程,掌握数据挖掘相关工具的使用。 内容: 将创建一个数据挖掘模型以训练销售数据,并使用“Microsoft 决策树”算法在客户群中找出会员卡选择模式。请将要挖掘的维度(事例维度)设置为客户,再将 Member_Card 成员的属性设置为数据挖掘算法识别模式时要使用的信息。然后选择人口统计特征列表,算法将从中确定模式:婚姻状况、年收入、在家子女数和教育程度。下一步需要训练模型,以便能够浏览树视图并从中读取模式。市场部将根据这些模式设计新的会员卡,使其适应申请各类会员卡的客户类型。 二、所用仪器、材料(设备名称、型号、规格等) 操作系统平台:Windows 7 数据库平台:SQL Server 2008 SP2 三、实验原理 知识发现被认为是从数据中发现有用知识的整个过程。数据挖掘被认为是KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式。KDD过程定义为:KDD是从数据集中识别出有效出、新颖的、潜在有用的,以及最终可理解的模式的高级处理过程。KDD过程可以概括为3部分:数据准备(data preparation),数据挖掘及结果的解释和评估(interpretation evaluation)。 数据挖掘的对象主要是关系数据库和数据仓库,这是典型的结构化数据。随着技术的发展,数据挖掘对象逐步扩大到半结构化或非结构化数据,这主要是文本数据、图像与视频数据以及Web数据等。 数据挖掘任务有6项:关联分析、时序模式、聚类、分类、偏差检测、预测。 数据挖掘方法是由人工智能、机器学习的方法发展而来,结合传统的统计分析方法、模糊数学方法以及科学计算可视化技术,以数据库为研究对象,形成了数据挖掘方法和技术。 数据挖掘方法和技术可以分为6大类: 归纳学习的信息论方法:ID3等方法(决策树方法)、IBLE方法(决策规则树方法) 归纳学习的集合论方法:粗糙集(rough set)方法、关联规则挖掘、覆盖正例排斥反例方法、概念树方法。 仿生物技术的神经网络方法:前馈式网络、反馈式网络、自组织网络 仿生物技术的遗传算法:繁殖(选择)、交叉(重组)、变异(突变) 数据数据的公式发现:物理定律发现系统BACON、经验公式发现系统FDD 可视化技术:提取几何图元、绘制、显示和演放 四、实验方法、步骤 要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其OLAP操作过程。实验完成后,应根据实验情况写出实验报告。 五、实验过程原始记录(数据、图表、计算等) 本实验使用Microsoft SQL Server的数据挖掘工具,对一组电信运营商的客户数据进行挖掘,分析客户流失特征,以此来预测当前可能流失的客户,为企业营销提供支持。 首先将待挖掘数据(存放于文本文件中)导入数据库 先在数据库中建立数据表(若直接导入,相应字段的数据类型不匹配,会影响挖掘效果) USE [DW] GO SET ANSI_NULLS ON GO SET QUOTED_IDENTIFIER ON GO CREATE TABLE [dbo].[大理PAS流失训练]( [SERV_ID] [float] NULL, --服务ID [CUST_ID] [float] NULL, [ZWSC] [float] NULL, --在网时长 [BILLING_MODE_ID] [float] NULL, [PAYMENT_METHOD] [float] NULL, --付费方式 [ORG_ID] [float] NULL, --地区ID [NEW_YXSX] [float] NULL, [ZWSC_DSC] [nvarchar](255) NULL, [KB] [nvarchar](255) NULL, --捆绑其他业务 [AGE] [nvarchar](255) NULL, --年龄 [LX] [nvarchar](255) NULL, --来电显示 [CL] [nvarchar](255) NULL, --彩铃 [FEE_ALL] [nvarchar](255) NULL, [YC] [nvarchar](255) NULL, --预存 [IS_LS] [float] NULL --是否流失, 0表示未流失, 1表示流失 ) ON [PRIMARY] GO 导入待挖掘数据 打开Microsoft的SQL Server Business Intelligence Development Studio工具

文档评论(0)

xx88606 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档