Python数据分析与实战（微课版）课件第10章基于TipDM大数据挖掘建模平台实现客户流失预测.pptx

下载文档

0
0
约5.88千字
约 58页
2025-04-22 发布于福建
举报
版权申诉
保障服务

Python数据分析与实战（微课版）课件第10章基于TipDM大数据挖掘建模平台实现客户流失预测.pptx

1、本文档共58页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于TipDM大数据挖掘建模平台实现客户流失预测;;TipDM大数据挖掘建模平台是由广东泰迪智能科技股份有限公司自主研发，面向大数据挖掘项目的工具。

平台使用Java语言开发，采用B/S（Browser/Server，浏览器/服务器）结构，用户不需要下载客户端，可通过浏览器进行访问。

平台具有支持多种语言、操作简单、用户无须具备编程语言基础等特点，以流程化的方式将数据输入/输出、统计分析、数据预处理、挖掘与建模等环节进行连接，从而实现大数据挖掘。

读者可通过访问平台查看具体的界面情况，操作方法如下。

微信搜索公众号“泰迪学社”或“TipDataMining”，关注公众号。

关注公众号后，回复“建模平台”，获取平台访问方式。

;平台界面如图所示。;在介绍如何使用大数据挖掘建模平台实现项目分析之前，需要引入平台的几个概念，其基本介绍如表所示。

;TipDM大数据挖掘建模平台主要有以下几个特点。

平台组件基于Python、R以及Hadoop/Spark分布式引擎，适用于数据分析。Python、R以及Hadoop/Spark是常见的用于数据分析的语言或工具，高度契合行业需求。

用户可在没有Python、R或Hadoop/Spark编程基础的情况下，使用直观的拖曳式图形界面构建数据分析流程，无须编程。

平台提供公开可用的数据分析示例工程，实现一键创建，快速运行。支持挖掘流程每个节点的结果在线预览。

平台包含Python、Spark、R这3种工具的组件包，用户可以根据实际需求灵活选择不同的语言进行数据挖掘建模。

下面将对平台“共享库”“数据连接”“数据集”“我的工程”“个人组件”这5个模块进行介绍。;登录平台后，用户即可看到“共享库”模块提供的示例工程（模板），如图所示。;“共享库”模块主要用于标准大数据挖掘建模案例的快速创建和展示。

通过“共享库”模块，用户可以创建一个无须导入数据及配置参数就能够快速运行的工程。

用户可以将自己创建的工程公开到“共享库”模块，作为工程模板，供其他用户一键创建。

同时，每一个模板的创建者都具有模板的所有权，能够对模板进行管理。

;“数据连接”模块支持从Db2、SQLServer、MySQL、Oracle、PostgreSQL等常用关系数据库中导入数据，导入数据时的“新建连接”对话框如图所示。;“数据集”模块主要用于数据挖掘建模工程中数据的导入与管理，支持从本地导入任意类型的数据。导入数据时的“新增数据集”对话框如图所示。;“我的工程”模块主要用于数据挖掘建模流程的创建与管理，工程示例流程如图所示。

通过单击“工程”栏下的（“新建工程”）按钮，用户可以创建空白工程并通过“组件”栏下的组件进行工程配置，将数据输入/输出、预处理、挖掘建模、模型评估等环节通过流程化的方式进行连接，达到数据挖掘与分析的目的。

对于完成度高的工程，可以将其公开到“共享库”中，作为模板让其他使用者学习和借鉴。;在“组件”栏下，平台提供了输入/输出组件、Python组件、R语言组件、Spark组件等系统组件，如图所示，用户可直接使用。输入/输出组件包括输入源、输出源、输出到数据库等。下面将具体介绍Python组件、R语言组件和Spark组件。;Python组件包含Python脚本、预处理、统计分析、时间序列、分类、模型评估、模型预测、回归、聚类、关联规则、文本分析、深度学习和绘图，共13类。Python组件的类别介绍如表所示。;Python组件的类别介绍如表所示（续表）。;R语言组件包含R语言脚本、预处理、统计分析、分类、时间序列、聚类、回归和关联分析，共8类，R语言组件的类别介绍如表所示。

;R语言组件的类别介绍如表所示（续表）。;Spark组件包含预处理、统计分析、分类、聚类、回归、降维、协同过滤和频繁模式挖掘，共8类，Spark组件的类别介绍如表所示。

;Spark组件的类别介绍如表所示（续表）。;“个人组件”模块主要是为了满足用户的个性化需求。用户在使用过程中，可根据自己的需求定制组件，方便使用。目前支持通过Python和R语言进行个人组件的定制，定制个人组件如图所示。

;;在TipDM大数据挖掘建模平台上配置客户流失预测案例的总体流程如图所示。;在TipDM大数据挖掘建模平台上配置客户流失预测案例主要包括以下4个步骤。

数据源配置。在TipDM大数据挖掘建模平台配置客户信息表、订单详情表的输入源组件。

数据预处理。探索相关数据后，对数据进行查看缺失值、处理异常值、处理缺失值、构建特征等处理。

模型构建与训练。训练决策树和支持向量机模型。

模型评价。使用混淆矩阵对训练好的模型进行评价（注：平台已设定在构建与训练模型的同时进行模型评价操作）。

;在平台上配置案例得到的流程如图所示。;本案例的数据为两份CSV文件，一份为客户信

您可能关注的文档

文档评论（0）

xiaobao + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

Python数据分析与实战（微课版）课件第10章基于TipDM大数据挖掘建模平台实现客户流失预测.pptx