- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
利用 K-Means 聚类进行航空公司客户价值分析
1.背景与挖掘目标 1.1 背景航空公司业务竞争激烈,从
产品中心转化为客户中心。针对不同类型客户,进行精准营
销,实现利润最大化。建立客户价值评估模型,进行客户分
类,是解决问题的办法 1.2 挖掘目标借助航空公司客户数据,
对客户进行分类。对不同的客户类别进行特征分析,比较不
同类客户的客户价值对不同价值的客户类别提供个性化服
务,制定相应的营销策略。详情数据见数据集内容中的
air_data.csv 和客户信息属性说明 2.分析方法与过程 2.1 分析
方法首先,明确目标是客户价值识别。识别客户价值,应用
最广泛的模型是三个指标(消费时间间隔( Recency),消费
频率 (Frequency),消费金额 (Monetary ))以上指标简称 RFM
模型,作用是识别高价值的客户消费金额,一般表示一段时
间内,消费的总额。但是,因为航空票价收到距离和舱位等
级的影响,同样金额对航空公司价值不同。因此,需要修改
指标。选定变量,舱位因素 =舱位所对应的折扣系数的平均
值=C ,距离因素 =一定时间内积累的飞行里程 =M 。再考虑到,
航空公司的会员系统,用户的入会时间长短能在一定程度上
影响客户价值,所以增加指标 L= 入会时间长度 =客户关系长
度总共确定了五个指标, 消费时间间隔 R,客户关系长度 L ,
消费频率 F,飞行里程 M 和折扣系数的平均值 C 以上指标,
作为航空公司识别客户价值指标,记为 LRFMC 模型如果采
用传统的 RFM 模型,如下图。它是依据,各个属性的平均
值进行划分,但是,细分的客户群太多,精准营销的成本太
高。
综上,这次案例,采用聚类的办法进行识别客户价值,以
LRFMC 模型为基础本案例,总体流程如下图
2.2 挖掘步骤从航空公司,选择性抽取与新增数据抽取,形
成历史数据和增量数据对步骤一的两个数据,进行数据探索
性分析和预处理,主要有缺失值与异常值的分析处理,属性
规约、清洗和变换利用步骤 2 中的已处理数据作为建模数据,
基于旅客价值的 LRFMC 模型进行客户分群,对各个客户群
再进行特征分析,识别有价值客户。针对模型结果得到不同
价值的客户, 采用不同的营销手段, 指定定制化的营销服务,
或者针对性的优惠与关怀。 (重点维护老客户) 2.3 数据抽取
选取, 2014-03-31 为结束时间,选取宽度为两年的时间段,
作为观测窗口,抽取观测窗口内所有客户的详细数据,形成
历史数据对于后续新增的客户信息,采用目前的时间作为重
点,形成新增数据 2.4 探索性分析本案例的探索分析,主要
对数据进行缺失值和异常值分析。发现,存在票价为控制,
折扣率为 0,飞行公里数为 0 。票价为空值,可能是不存在
飞行记录, 其他空值可能是, 飞机票来自于积分兑换等渠道,
查找每列属性观测值中空值的个数、最大值、最小值的代码
如下。 import pandas as pd
datafile= r/home/kesci/input/date27730/air_data.csv # 航空原始
数据 ,第一行为属性标签
resultfile = r/home/kesci/work/test.xls # 数据探索结果表
data = pd.read_csv(datafile, encoding = utf-8) # 读取原始数
据,指定 U
您可能关注的文档
最近下载
- 2025年新苏教版数学一年级下册整册课件.pptx
- 2025年春季教导处工作计划.doc VIP
- 安全生产风险分级管控与隐患排查治理的成功案例分析.pptx
- 2024年辽宁省大连市中考数学试卷(含答案及解析).docx
- 中华护理学会团体标准TCNAS21─2024解读:胰岛素皮下注射.pptx VIP
- 最新全国各地中考语文满分作文.doc
- 【2025春】冀教版四年级数学下册教学计划(含进度表).docx
- 2025年中考语文总复习:《整本书阅读(名著阅读12部)》教材知识梳理.docx VIP
- 最终印刷版:全国杜仲产业发展规划(2016年-2030年).pdf VIP
- 卫生事业管理学讲义.ppt
文档评论(0)