- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
机器学习徐国清K-Means聚类应用一河南工业职业技术学院
目录目标分析数据准备特征工程模型训练性能度量
背景目前,企业的业务也在逐步由产品为主导向客户需求为主导转型。一种全新的“以客户为中心”的业务模式正在形成并被提升到前所未有的高度。不同运输方式间的竞争日趋激烈,航空公司面临的压力越来越大。航空公司属于典型的服务行业,其目的是获取更多的利润,然而当今航空公司产品同质化现象严重,并且竞争激烈,客户资源成为航空公司最为短缺的资源。
背景客户营销战略的倡导者从国外数百家公司进行了客户营销实施的经验中提炼了如下经验。公司收入的80%来自顶端的20%的客户。20%的客户带来的利润率能够达到100%。90%以上的收入来自现有客户。大部分的营销预算经常被用在非现有客户上。5%至30%的客户在客户金字塔中具有升级潜力。客户金字塔中客户升级2%,意味着销售收入增加10%,利润增加50%。
数据说明目前该航空公司已积累了大量的会员档案信息和其乘坐航班记录,以2014年3月31日为结束时间抽取两年内有乘机记录的所有客户的详细数据。数据包含会员卡号、入会时间、性别、年龄、会员卡级别、工作地城市、工作地所在省份、工作地所在国家、观测窗口结束时间、观测窗口乘机积分、飞行公里数、飞行次数、飞行时间、乘机时间间隔、平均折扣率等特征。
数据说明特征名称特征说明客户基本信息MEMBER_NO会员卡号FFP_DATE入会时间FIRST_FLIGHT_DATE第一次飞行日期GENDER性别FFP_TIER会员卡级别WORK_CITY工作地城市
分析目标本案例的总体流程主要包括以下4个步骤。抽取航空公司2012年4月1日至2014年3月31日的数据。对抽取的数据进行数据清洗、特征构建和标准化等操作。基于RFM模型,使用K-Means算法进行客户分群。针对模型结果得到不同价值的客户,采用不同的营销手段,提供定制化的服务。
数据探索以2014年3月31日为结束时间,选取宽度为两年(2012年4月1日~2014年3月31日)的时间段作为分析观测窗口,总共62988条记录。发现数据中存在缺失值和异常值,因此在数据清洗过程中要重点对这两类数据进行处理。在数据清洗过程中,因为原始数据量大,缺失值和异常值在数据集中占比较小,所以需要对缺失值和异常值均进行删除处理。
特征工程在建模之前需要对原始数据特征进行处理,筛选出更好的特征,才能获取更好的训练数据,让建立的模型能够得到更加精确的结果。特征构造是指从原始数据中人工的构建一些具有实际意义的特征,本案例借助RFM模型进行特征构造。
特征构造RFM模型RFM模型具体的含义如下。R(Recency)指的是最近一次消费时间与截止时间的间隔,简称时间间隔。最近一次消费时间与截止时间的间隔不仅能够为确定促销客户群体提供依据,还能够从中得出企业发展的趋势。
特征构造F(Frequency)指顾客在某段时间内所消费的次数,简称消费频率。可以说消费频率越高的顾客,也是满意度越高的顾客,其忠诚度也就越高,顾客价值也就越大。
特征构造M(Monetary)M(Monetary)指顾客在某段时间内所消费的金额,简称消费金额。消费金额越大的顾客,他们的消费能力自然也就越大,这就是所谓“20%的顾客贡献了80%的销售额”的二八法则。在RFM模型理论中,时间间隔、消费频率、消费金额是判别客户价值最重要的特征,这3个特征对营销活动的具有十分重要的意义,其中,时间间隔是最有力的特征。
机器学习徐国清K-Means聚类应用一河南工业职业技术学院
您可能关注的文档
- PracticalEnglishforInternationalCruiseShipCrew国际邮轮服务英语24课件讲解.pptx
- PracticalEnglishforInternationalCruiseShipCrew国际邮轮服务英语36课件讲解.pptx
- PracticalEnglishforInternationalCruiseShipCrew国际邮轮服务英语41课件讲解.pptx
- PracticalEnglishforInternationalCruiseShipCrew国际邮轮服务英语47课件讲解.pptx
- PracticalEnglishforInternationalCruiseShipCrew国际邮轮服务英语48课件讲解.pptx
- IO流概述罗祥裕96课件讲解.pptx
- IP数据报的转发52课件讲解.pptx
- Iterator接口赵耀宏16课件讲解.pptx
- Java语言的技术平台李冬29课件讲解.pptx
- Java语言发展历史李冬64课件讲解.pptx
- KNN模型机器学习08课件讲解.pptx
- KNN模型机器学习53课件讲解.pptx
- KNN应用案例机器学习07课件讲解.pptx
- Liaison用法解析容铭刚14课件讲解.pptx
- Linux系统管理5基本磁盘和逻辑卷的管理RedHatEnterpriseLinux80RHEL8015课件讲解.pptx
- Linux系统管理6软件包服务和进程的管理RedHatEnterpriseLinux80RHEL8040课件讲解.pptx
- Linux系统管理7网络配置与Firewalld防火墙的管理RedHatEnterpriseLinux80RHEL8042课件讲解.pptx
- Linux系统管理9使用DHCP动态分配主机地址RedHatEnterpriseLinux80RHEL8037课件讲解.pptx
- Linux系统管理11使用Apache部署Web网站RedHatEnterpriseLinux80RHEL8010课件讲解.pptx
- Linux系统管理12使用MariaDB管理数据库RedHatEnterpriseLinux80RHEL8074课件讲解.pptx
最近下载
- 催收工作流程介绍..ppt VIP
- 村文书选聘真题及答案汇总.docx VIP
- 长城哈弗H9-2022款_汽车使用手册用户操作图解驾驶车主车辆说明书电子版.pdf
- 2.3.3+中国的河流与湖泊—长江+课件-2025-2026学年八年级上册湘教版地理.pptx VIP
- 小学一年级语文第一册期末试卷4[人教版].doc VIP
- 2005年北京市房地产市场总结.pdf
- 2025《模块化多电平逆变器的调制策略及仿真设计》5200字.docx VIP
- 村文书考试真题及答案.docx VIP
- 2-3+中国的河流——长江+课件+2023-2024学年八年级地理上册湘教版.pptx VIP
- Spss统计应用基础第一章N.ppt VIP
原创力文档


文档评论(0)