- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘原理与SPSS Clementine应用宝典 元昌安 主编 邓 松 李文敬 刘海涛 编著 电子工业出版社 23.1数据挖掘项目实施步骤 23.1.1一般实施步骤? 一般而言,数据挖掘项目要经历的过程包括:问题理解和提出、?数据准备、数据整理?、建立模型、评价和解释等一系列任务,其流程如图23-1所示 。 23.1.2企业解决方案 23.1.2.1 SEMMA模式 23.1.2.2 SPSS-5A模型 23.2数据挖掘项目周期 23.3建立项目和报告 23.3.1项目概述 表面上,Clementine项目只是一种组织输出的简单方式,但实际上它能做更多的工作,主要包括以下工作: (1)注释项目文件中的每个对象。 (2)使用CRISP-DM方法指导数据挖掘工作。项目还包含CRISP-DM帮助系统,该系统针对使用CRISP-DM进行的数据挖掘提供详细信息以及现实示例。 (3)将非Clementine项目添加到Clementine项目,如用于展现数据挖掘目标的PowerPoint幻灯片或与计划使用的算法相关的文档等。 (4)根据注解生成全面更新报告和简单更新报告。为了便于在局域网上发布,可以用HTML的形式生成这些报告。 23.3.1.1CRISP-DM视图 23.3.1.2类视图 23.3.2建立项目 23.3.2.1新建项目 在Clementine窗口中新建项目非常简单。可以从构建新项目开始(如果没有项目打开),也可以关闭现有项目并重新开始。 从流工作区菜单中,选择“文件”→“工程” →“新建工程...”命令。 23.3.2.2添加到项目 创建或打开项目后,便可以使用多种方法来添加对象,如数据流、节点和报告等。 (1)用管理器添加对象 使用Clementine窗口右上角的管理器,可以添加流或输出。 从其中一个管理器选项卡中选择一个对象(如表或流)。 右键单击,然后选择“添加到工程”命令。 如果以前保存过该对象,则会自动将它添加到适当的对象文件夹(在类视图中)或默认的阶段文件夹(在CRISP-DM 视图中)。 或者,可以将对象从管理器拖放到项目工作区中。 将项目添加到项目工程中,如图23-7从项目管理器中加入项目项到工程中所示。 (2)从工作区添加节点 可以使用“保存”对话框从流工作区添加单个节点。 在工作区中选择一个节点。 单击右键,然后选择“保存节点”命令;或者,从菜单中选择“编辑”→“节点”→“保存节点...”命令。 在“保存”对话框中,选中“将文件添加到工程”命令。 为节点创建名称,然后单击“保存”命令。 从流工作区中加入节点的主要操作对话框如图23-8从流工作区中加入节点所示,这样会保存文件并将其添加到项目中,同时节点会被添加到类视图中的Nodes文件夹以及CRISP-DM视图中的默认阶段文件夹。 (3)添加外部文件 将外部文件添加到项目的一般步骤如下: Step1.将文件从桌面上直接拖到项目中;或右键单击CRISP-DM视图或类视图中的目标文件夹。 Step2.从菜单中,选择“添加到文件夹”命令。 Step3.在对话框中选择一个文件,然后单击“打开”命令。 这将会在Clementine项目内添加对所选对象的引用。 23.3.2.3设置项目属性 可以使用项目属性对话框来自定义项目的内容和文档。要访问项目属性,一般执行以下操作:Step1.右键单击项目工具中的根文件夹,然后选择“工程属性”命令;或者右键单击项目工具中的非根文件夹,然后选择“工程” →“工程属性”命令。工程选项卡对话框如图23-9工程选项卡对话框所示。Step2.单击“工程”选项卡以指定项目的相关信息。? 在工程选项卡中包含下列信息,如图23-9工程选项卡对话框所示。 创建时间:显示项目的创建时间(此项内容不可编辑)。 摘要:可以输入将在项目报告中显示的数据挖掘项目的摘要。 内容:列出项目文件引用的组成文件的类型和数量(此项内容不可编辑)。 将未保存的对象保另存为单选项:指定是应将未保存的对象保存到本地文件系统还是存储在Predictive Enterprise Repository 中。 载入项目时更新对象引用复选框:选中此选项可更新项目对其组成文件的引用。 23.3.2.4注解项目 项目工具提供了多种方式来注解数据挖掘工作。项目级注解常用于跟踪宏观目标和决策,而文件夹或节点注解提供其他详细信息。“注解”选项卡提供了足够空间记录项目级详细信息,比如具有不可恢复丢失数据的数据排除、数据探索过程中形成的可能假设等。 23.3.2.5对象属性 可以查看对象属性并选择是否在项目报告中纳入单个对象。要访问对象属性,需要执行
文档评论(0)