Python数据分析与应用-第7章-航空公司客户价值分析.pptVIP

下载本文档

0
0
约2.47千字
约 31页
2025-12-03 发布于北京
举报
版权申诉

Python数据分析与应用-第7章-航空公司客户价值分析.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

航空公司客户价值分析;目录;分析航空公司现状;分析航空公司现状;目前航空公司已积累了大量的会员档案信息和其乘坐航班记录。

以2014-03-31为结束时间，选取宽度为两年的时间段作为分析观测窗口，抽取观测窗口内有乘机记录的所有客户的详细数据形成历史数据，44个特征，总共62988条记录。数据特征及其说明如右表所示。

;航空公司客户数据说明;原始数据中包含40多个特征，利用这些特征做些什么呢？我们又该从哪些角度出发呢？;借助航空公司客户数据，对客户进行分类。

对不同的客户类别进行特征分析，比较不同类别客户的客户价值。

对不同价值的客户类别提供个性化服务，制定相应的营销策略。

;公司收入的80%来自顶端的20%的客户。

20%的客户其利润率100%。

90%以上的收入来自现有客户。

大部分的营销预算经常被用在非现有客户上。

5%至30%的客户在客户金字塔中具有升级潜力。

客户金字塔中客户升级2%，意味着销售收入增加10%，利润增加50%。

这些经验也许并不完全准确，但是它揭示了新时代客户分化的趋势，也说明了对客户价值分析的迫切性和必要性。;熟悉航空客户价值分析的步骤与流程;目录;通过对数据观察发现原始数据中存在票价为空值，票价最小值为0，折扣率最小值为0，总飞行公里数大于0的记录。票价为空值的数据可能是客户不存在乘机记录造成。

处理方法：丢弃票价为空的记录。

其他的数据可能是客户乘坐0折机票或者积分兑换造成。由于原始数据量大，这类数据所占比例较小，对于问题影响不大，因此对其进行丢弃处理。

处理方法：丢弃票价为0，平均折扣率不为0，总飞行公里数大于0的记录。

;本项目的目标是客户价值分析，即通过航空公司客户数据识别不同价值的客户，识别客户价值应用最广泛的模型是RFM模型。

R（Recency）指的是最近一次消费时间与截止时间的间隔。通常情况下，最近一次消费时间与截止时间的间隔越短，对即时提供的商品或是服务也最有可能感兴趣。

F（Frequency）指顾客在某段时间内所消费的次数。可以说消费频率越高的顾客，也是满意度越高的顾客，其忠诚度也就越高，顾客价值也就越大。

M（Monetary）指顾客在??段时间内所消费的金额。消费金额越大的顾客，他们的消费能力自然也就越大，这就是所谓“20%的顾客贡献了80%的销售额”的二八法则。;RFM模型包括三个特征，使用三维坐标系进行展示，如图所示。X轴表示Recency，Y轴表示Frequency，Z轴表示Monetary，每个轴一般会分成5级表示程度，1为最小，5为最大。;在RFM模型中，消费金额表示在一段时间内，客户购买该企业产品金额的总和，由于航空票价受到运输距离，舱位等级等多种因素影响，同样消费金额的不同旅客对航空公司的价值是不同的，因此这个特征并不适合用于航空公司的客户价值分析。;本项目选择客户在一定时间内累积的飞行里程M和客户在一定时间内乘坐舱位所对应的折扣系数的平均值C两个特征代替消费金额。此外，航空公司会员入会时间的长短在一定程度上能够影响客户价值，所以在模型中增加客户关系长度L，作为区分客户的另一特征。

本项目将客户关系长度L，消费时间间隔R，消费频率F，飞行里程M和折扣系数的平均值C作为航空公司识别客户价值的关键特征（如表32所示），记为LRFMC模型。;完成五个特征的构建以后，对每个特征数据分布情况进行分析，其数据的取值范围如表所示。从表中数据可以发现，五个特征的取值范围数据差异较大，为了消除数量级数据带来的影响，需要对数据做标准化处理。;;目录;K-Means聚类算法是一种基于质心的划分方法，输入聚类个数k，以及包含n个数据对象的数据库，输出满足误差平方和最小标准的k个聚类。算法步骤如下。

从n个样本数据中随机选取k个对象作为初始的聚类中心。

分别计算每个样本到各个聚类质心的距离，将样本分配到距离最近的那个聚类中心类别中。

所有样本分配完成后，重新计算k个聚类的中心。

与前一次计算得到的k个聚类中心比较，如果聚类中心发生变化，转(2)，否则转(5)。

当质心不发生变化时停止并输出聚类结果。

;K-Means聚类算法是在数值类型数据的基础上进行研究，然而数据分析的样本复杂多样，因此要求不仅能够对特征为数值类型的数据进行分析，还要适应数据类型的变化，对不同特征做不同变换，以满足算法的要求。;K-Means算法在R语言中实现的核心函数为kmeans，来源于stats软件包，其基本语法如下。

kmeans(x,centers,iter.max=10,nstart=1,algorithm=c(Hartigan-Wong,Lloyd,Forgy,MacQueen)

常用参数及其说明如表所示。

;K-Means模型构建完成后可以通过属性查看不同的信息，如表所示。

您可能关注的文档

文档评论（0）

RealGenius + 关注: 实名认证

文档贡献者

如有不慎侵权，请联系删除!

咨询Ta 进入空间

1亿VIP精品文档

更多 >

Python数据分析与应用-第7章-航空公司客户价值分析.pptVIP