数据挖掘操作手册.PDF

数据挖掘操作手册

数据挖掘操作手册 一、平台界面 1.数据挖掘应用概览页面 登录 ETHINK 平台后,您可以对数据挖掘应用进行新增和编辑。 2.数据挖掘应用设计器页面 当您进入到数据挖掘设计器页面后,您可以根据系统提供的各种编辑 工作,管理数据挖掘和各个组件。 二、数据挖掘步骤 1、定义问题 该步骤包括分析业务需求,定义问题的范围,定义计算模型所使用的 度量,以及定义数据挖掘项目的特定目标。 2、准备数据 数据可以分散在公司的各个部门并以不同的格式存储。 数据清除不仅仅是删除错误数据或插入缺失值,还包括查找数据中的 隐含相关性、标识最准确的数据源并确定哪些列最适合用于分析。 3、浏览数据 浏览技术包括计算最小值和最大值,计算平均偏差和标准偏差,以及 查看数据的分布。 4、生成模型 通过创建挖掘结构定义要使用的数据列。将挖掘结构链接到数据源, 但只有对挖掘结构进行处理后,该结构才会实际包含数据。 5、浏览和验证模型 在将模型部署到生产环境之前,您需要测试模型的性能。此外,在生 成模型时,您通常需要使用不同配置创建多个模型,并对所有这些模 型进行测试,以便查看哪个模型为您的问题和数据生成最佳结果。 三、快速入门 登录 ETHINK 平台,单击添加-挖掘平台。 1.添加分析数据 在左侧组件区数据一栏中 ,拖拽数据输入并配置

文档评论(0)

1亿VIP精品文档

相关文档