- 1、本文档共58页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
基于TipDM大数据挖掘建模平台实现客户流失预测;;TipDM大数据挖掘建模平台是由广东泰迪智能科技股份有限公司自主研发,面向大数据挖掘项目的工具。
平台使用Java语言开发,采用B/S(Browser/Server,浏览器/服务器)结构,用户不需要下载客户端,可通过浏览器进行访问。
平台具有支持多种语言、操作简单、用户无须具备编程语言基础等特点,以流程化的方式将数据输入/输出、统计分析、数据预处理、挖掘与建模等环节进行连接,从而实现大数据挖掘。
读者可通过访问平台查看具体的界面情况,操作方法如下。
微信搜索公众号“泰迪学社”或“TipDataMining”,关注公众号。
关注公众号后,回复“建模平台”,获取平台访问方式。
;平台界面如图所示。;在介绍如何使用大数据挖掘建模平台实现项目分析之前,需要引入平台的几个概念,其基本介绍如表所示。
;TipDM大数据挖掘建模平台主要有以下几个特点。
平台组件基于Python、R以及Hadoop/Spark分布式引擎,适用于数据分析。Python、R以及Hadoop/Spark是常见的用于数据分析的语言或工具,高度契合行业需求。
用户可在没有Python、R或Hadoop/Spark编程基础的情况下,使用直观的拖曳式图形界面构建数据分析流程,无须编程。
平台提供公开可用的数据分析示例工程,实现一键创建,快速运行。支持挖掘流程每个节点的结果在线预览。
平台包含Python、Spark、R这3种工具的组件包,用户可以根据实际需求灵活选择不同的语言进行数据挖掘建模。
下面将对平台“共享库”“数据连接”“数据集”“我的工程”“个人组件”这5个模块进行介绍。;登录平台后,用户即可看到“共享库”模块提供的示例工程(模板),如图所示。;“共享库”模块主要用于标准大数据挖掘建模案例的快速创建和展示。
通过“共享库”模块,用户可以创建一个无须导入数据及配置参数就能够快速运行的工程。
用户可以将自己创建的工程公开到“共享库”模块,作为工程模板,供其他用户一键创建。
同时,每一个模板的创建者都具有模板的所有权,能够对模板进行管理。
;“数据连接”模块支持从Db2、SQLServer、MySQL、Oracle、PostgreSQL等常用关系数据库中导入数据,导入数据时的“新建连接”对话框如图所示。;“数据集”模块主要用于数据挖掘建模工程中数据的导入与管理,支持从本地导入任意类型的数据。导入数据时的“新增数据集”对话框如图所示。;“我的工程”模块主要用于数据挖掘建模流程的创建与管理,工程示例流程如图所示。
通过单击“工程”栏下的(“新建工程”)按钮,用户可以创建空白工程并通过“组件”栏下的组件进行工程配置,将数据输入/输出、预处理、挖掘建模、模型评估等环节通过流程化的方式进行连接,达到数据挖掘与分析的目的。
对于完成度高的工程,可以将其公开到“共享库”中,作为模板让其他使用者学习和借鉴。;在“组件”栏下,平台提供了输入/输出组件、Python组件、R语言组件、Spark组件等系统组件,如图所示,用户可直接使用。输入/输出组件包括输入源、输出源、输出到数据库等。下面将具体介绍Python组件、R语言组件和Spark组件。;Python组件包含Python脚本、预处理、统计分析、时间序列、分类、模型评估、模型预测、回归、聚类、关联规则、文本分析、深度学习和绘图,共13类。Python组件的类别介绍如表所示。;Python组件的类别介绍如表所示(续表)。;R语言组件包含R语言脚本、预处理、统计分析、分类、时间序列、聚类、回归和关联分析,共8类,R语言组件的类别介绍如表所示。
;R语言组件的类别介绍如表所示(续表)。;Spark组件包含预处理、统计分析、分类、聚类、回归、降维、协同过滤和频繁模式挖掘,共8类,Spark组件的类别介绍如表所示。
;Spark组件的类别介绍如表所示(续表)。;“个人组件”模块主要是为了满足用户的个性化需求。用户在使用过程中,可根据自己的需求定制组件,方便使用。目前支持通过Python和R语言进行个人组件的定制,定制个人组件如图所示。
;;在TipDM大数据挖掘建模平台上配置客户流失预测案例的总体流程如图所示。;在TipDM大数据挖掘建模平台上配置客户流失预测案例主要包括以下4个步骤。
数据源配置。在TipDM大数据挖掘建模平台配置客户信息表、订单详情表的输入源组件。
数据预处理。探索相关数据后,对数据进行查看缺失值、处理异常值、处理缺失值、构建特征等处理。
模型构建与训练。训练决策树和支持向量机模型。
模型评价。使用混淆矩阵对训练好的模型进行评价(注:平台已设定在构建与训练模型的同时进行模型评价操作)。
;在平台上配置案例得到的流程如图所示。;本案例的数据为两份CSV文件,一份为客户信
您可能关注的文档
- 矩阵理论 课件 第6章第3节矩阵的QR分解.ppt
- 矩阵理论 课件 第6章第4节矩阵的奇异值分解.ppt
- AutoCAD 2024中文版机械设计项目教学案例教程 教案 项目八 箱体和箱盖 .doc
- AutoCAD 2024中文版机械设计项目教学案例教程 教案 项目二 绘制简单机械图形 .doc
- AutoCAD 2024中文版机械设计项目教学案例教程 教案 项目九 减速箱装配图设计 .doc
- AutoCAD 2024中文版机械设计项目教学案例教程 教案 项目六 轴系类零件设计 .doc
- AutoCAD 2024中文版机械设计项目教学案例教程 教案 项目七 齿轮类零件设计 .doc
- AutoCAD 2024中文版机械设计项目教学案例教程 教案 项目三 绘制复杂机械图形 .doc
- AutoCAD 2024中文版机械设计项目教学案例教程 教案 项目四 标注机械图形 .doc
- AutoCAD 2024中文版机械设计项目教学案例教程 教案 项目五 灵活应用辅助绘图工具 .doc
- 2025年广东省《人文科技常识》必刷100题试卷带解析及答案1套.docx
- 2025年广东省《人文科技常识》必刷100题试卷带解析及答案(典优).docx
- 2025年新疆维吾尔自治区巴音郭楞蒙古自治州库尔勒市高三下学期物理基础题、中档题型强化训练.docx
- 2025年惠州工程职业学院单招综合素质考试题库推荐.docx
- 2025年抚顺职业技术学院单招职业倾向性考试题库最新.docx
- 2025年成都艺术职业大学单招职业技能考试题库推荐.docx
- 2025年惠州卫生职业技术学院单招职业倾向性考试题库附答案.docx
- 2025年惠州卫生职业技术学院单招职业倾向性考试题库推荐.docx
- 2025年成都艺术职业大学单招职业技能考试题库附答案.docx
- 2025年怀化师范高等专科学校单招职业适应性考试题库必考题.docx
最近下载
- 转速耦合混合动力汽车行星减速装置可靠性优化设计与分析.docx VIP
- 2025四川农商银行社会招聘800人笔试备考试题及答案解析.docx
- 2024年江西省鹰潭信江新区公开招聘村(社区)工作者12人公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx VIP
- 工程质量创优策划书(中建八局).docx
- YN803D系列多功能数字仪表.doc.docx VIP
- 分布式光伏发电项目报告(28页).pptx
- 工程质量管理考核制度.doc
- 直播电商运营(初级)营销师巨量认证考试题库(附答案).docx
- 2022年研究生类同等学力申请硕士学位教育学学科综合水平考试模拟题10.pdf VIP
- 学校围墙改造项目工程施工组织设计.docx VIP
文档评论(0)