基于logistic回归模型的大数据精准营销应用.docVIP

基于logistic回归模型的大数据精准营销应用.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于logistic回归模型的大数据精准营销应用.doc

基于logistic回归模型的大数据精准营销应用   摘 要:随着移动互联网的发展,电信运营商的传统语音和短信收入快速下降,同时流量价值也不断向云端结合的OTT服务商转移,挤压运营商收入增长空间。文章通过研究电信运营商大数据能力优势及精准营销需求,基于logistic回归模型,提出了电信运营商流量经营的大数据精准营销应用,有效提升客户的满意度,快速提高运营商效益。   关键词:logistic回归模型;大数据应用;运营商;流量经营   随着移动互联网的发展,流量已成为客户的核心需求,能否顺利从以“话务量”为中心的经营转向“流量经营”转型,能否通过流量经营提升公司的价值,已成为运营商战略转型的关键。移动互联网时代的流量经营与语音和宽带业务的经营有很大不同:客户使用的终端多样性,流量承载的内容性丰富,客户流量使用行为的数据的复杂性,仅通过传统的“暴力营销”极易引起客户的反感和投诉。基于logistic回归模型的大数据精准营销应用将有效解决提升客户满意度及运营商效益提升问题。   1 基于logistic回归模型的大数据精准营销应用的解决方案   1.1 基本思路   根据用户的特征,判别哪些是诱发用户订购流量包的因素,使用logistic回归分析出其影响权重,从而预测哪些用户是潜在的订购用户。   1.2 logistic模型   根据样本数据可以通过最似然估计法计算出模型参数。   1.3 抽取数据   抽取五大类11子项数据作为分析颗粒度。   1.4 数据描述   本模型使用部分流量包订购数据,它有94455个样本观测,每个观测包括12个变量:   用户号码(phone)、使用流量(current_flow)、套餐类型(taocan_type)、终端类型(os)、用户类型(utype)、订购状态(order)、套餐消耗比(main_rate)、日均使用流量(avg_day_flow)、闲时消耗比(free_rate)、活跃度(day_log_count)、APP个数(client_count)和潜力值(big_client_pv)。   1.4.1 观测样本套餐划分情况:   3G套餐包括A/B/C/iPhone/wopai,占比为36%;2G套餐根据流量分为流量卡(占比28%)和非流量卡(占比35%)。   1.4.2 观测样本终端情况   Android操作系统用户占比达51%,iOS操作系统用户占比为9%。   1.4.3观测样本流量使用情况   把观测样本用户使用流量划分成8个区间,对流量需求旺盛用户开展流量包营销非常必要。(图3)   1.4.4 观测样本流量饱和度情况   极大部分用户都出现了流量超套行为,占一半用户以上,进行合适的流量包推送很在必要。(图4)   2 基于logistic回归模型的大数据精准营销应用的模型建立   2.1 数据   随机抽取80%的数据(75564条)建立一个logistic模型,再用余下20%的数据(18891条)进行预测。   2.2 方法   多元logistic模型,使用stepwise选择变量。   2.3 变量   涉及多个分类变量-用户类型、终端类型和套餐类型,设置哑变量处理,并设置相应的参照水平-3G用户、Andriod终端和A套餐。   2.4 影响因素参数估计   2.4.1 整体显著性检验   假设:H0:b1=b2=…=bn=0;H1:b1,b2,…bn不全为0。   检验的结果如下所示:从表4中可以看到p-value0.0001,拒绝原假设,说明回归系数对模型有显著性的影响,这个模型整体上比空模型更显著。   2.4.2 参数估计   从表5中可以看到9个因素的回归系数都通过了Wald Chi-Square检验,说明各系数在统计上是显著的。   2.5 模型结论   闲时消耗率、终端类型、套餐类型为此模型中诱发订购行为的最重要的三个因素。(表6)   2.6 参数意义   回归的系数给出了概率的对数变化一个单位对应的预测变量的增加。OR比是取幂的系数,可以解释为乘法概率增加一单位预测变量的变化。3G用户相对于2G用户:订购概率的对数增加1.7443;订购的概率相对不订购的概率增加0.175。Current_flow增加1M:订购概率的对数增加0.00116;订购的概率相对不订购的概率增加1.001。(表7)   2.7 模型描述   预测模型:   3 基于logistic回归模型的大数据精准营销应用监测及实施案例   (1)对 18891个用户数据进行预测,ROC曲线如下:   ?订购覆盖率Sensitivity=正确预测到的订购数/实际订购总数   ?未订

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档