网站大量收购独家精品文档,联系QQ:2885784924

Python数据分析与实战(微课版)课件 第10章 基于TipDM大数据挖掘建模平台实现客户流失预测.pptx

Python数据分析与实战(微课版)课件 第10章 基于TipDM大数据挖掘建模平台实现客户流失预测.pptx

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

基于TipDM大数据挖掘建模平台实现客户流失预测;;TipDM大数据挖掘建模平台是由广东泰迪智能科技股份有限公司自主研发,面向大数据挖掘项目的工具。

平台使用Java语言开发,采用B/S(Browser/Server,浏览器/服务器)结构,用户不需要下载客户端,可通过浏览器进行访问。

平台具有支持多种语言、操作简单、用户无须具备编程语言基础等特点,以流程化的方式将数据输入/输出、统计分析、数据预处理、挖掘与建模等环节进行连接,从而实现大数据挖掘。

读者可通过访问平台查看具体的界面情况,操作方法如下。

微信搜索公众号“泰迪学社”或“TipDataMining”,关注公众号。

关注公众号后,回复“建模平台”,获取平台访问方式。

;平台界面如图所示。;在介绍如何使用大数据挖掘建模平台实现项目分析之前,需要引入平台的几个概念,其基本介绍如表所示。

;TipDM大数据挖掘建模平台主要有以下几个特点。

平台组件基于Python、R以及Hadoop/Spark分布式引擎,适用于数据分析。Python、R以及Hadoop/Spark是常见的用于数据分析的语言或工具,高度契合行业需求。

用户可在没有Python、R或Hadoop/Spark编程基础的情况下,使用直观的拖曳式图形界面构建数据分析流程,无须编程。

平台提供公开可用的数据分析示例工程,实现一键创建,快速运行。支持挖掘流程每个节点的结果在线预览。

平台包含Python、Spark、R这3种工具的组件包,用户可以根据实际需求灵活选择不同的语言进行数据挖掘建模。

下面将对平台“共享库”“数据连接”“数据集”“我的工程”“个人组件”这5个模块进行介绍。;登录平台后,用户即可看到“共享库”模块提供的示例工程(模板),如图所示。;“共享库”模块主要用于标准大数据挖掘建模案例的快速创建和展示。

通过“共享库”模块,用户可以创建一个无须导入数据及配置参数就能够快速运行的工程。

用户可以将自己创建的工程公开到“共享库”模块,作为工程模板,供其他用户一键创建。

同时,每一个模板的创建者都具有模板的所有权,能够对模板进行管理。

;“数据连接”模块支持从Db2、SQLServer、MySQL、Oracle、PostgreSQL等常用关系数据库中导入数据,导入数据时的“新建连接”对话框如图所示。;“数据集”模块主要用于数据挖掘建模工程中数据的导入与管理,支持从本地导入任意类型的数据。导入数据时的“新增数据集”对话框如图所示。;“我的工程”模块主要用于数据挖掘建模流程的创建与管理,工程示例流程如图所示。

通过单击“工程”栏下的(“新建工程”)按钮,用户可以创建空白工程并通过“组件”栏下的组件进行工程配置,将数据输入/输出、预处理、挖掘建模、模型评估等环节通过流程化的方式进行连接,达到数据挖掘与分析的目的。

对于完成度高的工程,可以将其公开到“共享库”中,作为模板让其他使用者学习和借鉴。;在“组件”栏下,平台提供了输入/输出组件、Python组件、R语言组件、Spark组件等系统组件,如图所示,用户可直接使用。输入/输出组件包括输入源、输出源、输出到数据库等。下面将具体介绍Python组件、R语言组件和Spark组件。;Python组件包含Python脚本、预处理、统计分析、时间序列、分类、模型评估、模型预测、回归、聚类、关联规则、文本分析、深度学习和绘图,共13类。Python组件的类别介绍如表所示。;Python组件的类别介绍如表所示(续表)。;R语言组件包含R语言脚本、预处理、统计分析、分类、时间序列、聚类、回归和关联分析,共8类,R语言组件的类别介绍如表所示。

;R语言组件的类别介绍如表所示(续表)。;Spark组件包含预处理、统计分析、分类、聚类、回归、降维、协同过滤和频繁模式挖掘,共8类,Spark组件的类别介绍如表所示。

;Spark组件的类别介绍如表所示(续表)。;“个人组件”模块主要是为了满足用户的个性化需求。用户在使用过程中,可根据自己的需求定制组件,方便使用。目前支持通过Python和R语言进行个人组件的定制,定制个人组件如图所示。

;;在TipDM大数据挖掘建模平台上配置客户流失预测案例的总体流程如图所示。;在TipDM大数据挖掘建模平台上配置客户流失预测案例主要包括以下4个步骤。

数据源配置。在TipDM大数据挖掘建模平台配置客户信息表、订单详情表的输入源组件。

数据预处理。探索相关数据后,对数据进行查看缺失值、处理异常值、处理缺失值、构建特征等处理。

模型构建与训练。训练决策树和支持向量机模型。

模型评价。使用混淆矩阵对训练好的模型进行评价(注:平台已设定在构建与训练模型的同时进行模型评价操作)。

;在平台上配置案例得到的流程如图所示。;本案例的数据为两份CSV文件,一份为客户信

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档