《数据仓库与数据挖掘》实验指导书47.docVIP

《数据仓库与数据挖掘》实验指导书47.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数据仓库与数据挖掘》实验指导书47

《》实验指导书 (适用于专业) 目 录 前 言 1 实验一、SPSS Clementine 软件功能演练 5 实验二、SPSS Clementine 数据可视化 9 实验三、决策树C5.0 建模 10 实验四、关联规则挖掘 21 实验五、欺诈屏蔽/异常检测/神经网络 29 实验六、分类和回归树节点(CRT) 40 实验七、多项 Logistic 回归 50 实验八、综合实验:电力负荷预测 56 前 言 一、课程简介 数据挖掘(Data Mining),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘的广义观点:数据挖掘就是从存放在数据库,数据仓库或其他信息库中的大量的数据中“挖掘”有趣知识的过程。数据挖掘,又称为数据库中知识发现(Knowledge Discovery in Database, KDD),因此,数据挖掘和数据仓库的协同工作,一方面,可以迎合和简化数据挖掘过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数据来源的广泛性和完整性。另一方面,数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。 数据挖掘有机结合了来自多学科技术,其中包括:数据库、数理统计、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像与信号处理、空间数据分析等,这里我们强调数据挖掘所处理的是大规模数据,且其挖掘算法应是高效的和可扩展的。通过数据挖掘,可从数据库中挖掘出有意义的知识、规律,或更高层次的信息,并可以从多个角度对其进行浏览察看。所挖掘出的知识可以帮助进行决策支持、过程控制、信息管理、查询处理等等。因此数据挖掘被认为是数据库系统最重要的前沿研究领域之一,也是信息工业中最富有前景的数据库应用领域之一。当前数据挖掘应用主要集中在电信、零售、农业、网络日志、银行、电力、生物、天体、化工、医药等方面。而据Gartner的报告也指出,数据挖掘会成为未来10年内重要的技术之一。 二、课程的任务和实验的教学目标 课程编号:5405190 课程属性:专业任选课 实验学时:12 适用专业:信息管理与信息系统 先修课程:管理信息系统、计算机基础、数据库技术、统计学 《数据仓库与数据挖掘》是一门理论和实践相结合的课程它在整个中处于地位是计算机科学的算法理论基础和主要算法设计和的能力,加深对数据算法的理解。 数据挖掘Clementine应用实务,谢邦昌 主编,机械工业出版社,2008.4 数据挖掘原理与SPSS Clementine应用宝典,元昌安 主编,电子工业出版社,2009.8 四、实验基本内容及学时分配 按照《数据仓库与数据挖掘》实验教学大纲的要求,共设立实验8个,总计20学时。试验基本内容与学时分配如下表: 序号 实验名称 实验学时 每组人数 实验属性 实验者类别 开出要求 本科 本科 验证综合 本科 4 关联规则挖掘 2 1 验证综合 本科 5 欺诈屏蔽/异常检测/神经网络 2 1 验证综合 本科 6 分类和回归树节点(CRT) 2 1 验证综合 本科 7 多项 Logistic 回归 2 1 验证综合 本科 本科 实验一、SPSS Clementine 软件功能演练 【实验目的】 1、熟悉SPSS Clementine 软件功能和操作特点。 2、了解SPSS Clementine 软件的各选项面板和操作方法。 3、熟练掌握SPSS Clementine 工作流程。 【实验内容】 1、打开SPSS Clementine 软件,逐一操作各选项,熟悉软件功能。 2、打开一有数据库、或新建数据文件,读入SPSS Clementine,并使用各种输出节点,熟悉数据输入输出。(要求:至少做access数据库文件、excel文件、txt文件、可变文件的导入、导出) 【实验步骤】 1、启动 Clementine: 请从 Windows 的“开始”菜单中选择: 所有程序 SPSS Clementine 11.1 SPSS Clementine client 11.1 2、Clementine窗口 当第一次启动 Clementine 时,工作区将以默认视图打开。中间的区域称作流工作区。在 Clementine 中,这将是用来工作的主要区域。 Clementine 中绝大部分的数据和建模工具都在选项板中,该区域位于流工作区的下方。每个选项卡都包含一组以图形表示数据挖掘任务的节点,例如访问和过滤数据,创建图形和构建模型。 窗口右侧底部的部分是工程工具,它用来创建和管理数据挖掘工程。查看在 Clementine 中创建的工程有两种方式 - 类视图或 CRISP-DM 视图。 “CRISP-DM”选项卡提供了一种组织工程的方式。“类”选项卡提供了一种在 Cl

文档评论(0)

seunk + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档