网站大量收购闲置独家精品文档,联系QQ:2885784924

利用K-Means聚类进行航空公司客户价值分析.pdf

利用K-Means聚类进行航空公司客户价值分析.pdf

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
利用 K-Means 聚类进行航空公司客户价值分析 1.背景与挖掘目标 1.1 背景航空公司业务竞争激烈,从 产品中心转化为客户中心。针对不同类型客户,进行精准营 销,实现利润最大化。建立客户价值评估模型,进行客户分 类,是解决问题的办法 1.2 挖掘目标借助航空公司客户数据, 对客户进行分类。对不同的客户类别进行特征分析,比较不 同类客户的客户价值对不同价值的客户类别提供个性化服 务,制定相应的营销策略。详情数据见数据集内容中的 air_data.csv 和客户信息属性说明 2.分析方法与过程 2.1 分析 方法首先,明确目标是客户价值识别。识别客户价值,应用 最广泛的模型是三个指标(消费时间间隔( Recency),消费 频率 (Frequency),消费金额 (Monetary ))以上指标简称 RFM 模型,作用是识别高价值的客户消费金额,一般表示一段时 间内,消费的总额。但是,因为航空票价收到距离和舱位等 级的影响,同样金额对航空公司价值不同。因此,需要修改 指标。选定变量,舱位因素 =舱位所对应的折扣系数的平均 值=C ,距离因素 =一定时间内积累的飞行里程 =M 。再考虑到, 航空公司的会员系统,用户的入会时间长短能在一定程度上 影响客户价值,所以增加指标 L= 入会时间长度 =客户关系长 度总共确定了五个指标, 消费时间间隔 R,客户关系长度 L , 消费频率 F,飞行里程 M 和折扣系数的平均值 C 以上指标, 作为航空公司识别客户价值指标,记为 LRFMC 模型如果采 用传统的 RFM 模型,如下图。它是依据,各个属性的平均 值进行划分,但是,细分的客户群太多,精准营销的成本太 高。 综上,这次案例,采用聚类的办法进行识别客户价值,以 LRFMC 模型为基础本案例,总体流程如下图 2.2 挖掘步骤从航空公司,选择性抽取与新增数据抽取,形 成历史数据和增量数据对步骤一的两个数据,进行数据探索 性分析和预处理,主要有缺失值与异常值的分析处理,属性 规约、清洗和变换利用步骤 2 中的已处理数据作为建模数据, 基于旅客价值的 LRFMC 模型进行客户分群,对各个客户群 再进行特征分析,识别有价值客户。针对模型结果得到不同 价值的客户, 采用不同的营销手段, 指定定制化的营销服务, 或者针对性的优惠与关怀。 (重点维护老客户) 2.3 数据抽取 选取, 2014-03-31 为结束时间,选取宽度为两年的时间段, 作为观测窗口,抽取观测窗口内所有客户的详细数据,形成 历史数据对于后续新增的客户信息,采用目前的时间作为重 点,形成新增数据 2.4 探索性分析本案例的探索分析,主要 对数据进行缺失值和异常值分析。发现,存在票价为控制, 折扣率为 0,飞行公里数为 0 。票价为空值,可能是不存在 飞行记录, 其他空值可能是, 飞机票来自于积分兑换等渠道, 查找每列属性观测值中空值的个数、最大值、最小值的代码 如下。 import pandas as pd datafile= r/home/kesci/input/date27730/air_data.csv # 航空原始 数据 ,第一行为属性标签 resultfile = r/home/kesci/work/test.xls # 数据探索结果表 data = pd.read_csv(datafile, encoding = utf-8) # 读取原始数 据,指定 U

文档评论(0)

tianya189 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地湖北
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档