- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
【优质】歌曲下载业务潜在用户模型(三季度).ppt
Thanks # # # # 第*页 2010-8-24 第*页 第*页 第*页 第*页 第*页 第*页 第*页 第*页 第*页 歌曲下载业务 潜在用户模型 研究背景 建模过程 模型检验及应用 目录 2010-7-1 定义:歌曲下载是指为客户提供完整的、高品质的正版数字音乐的单曲,下载的音乐全部是完整的,绝非高潮部分的试听版本的音乐。 特征: 提供完整、高品质的正版数字音乐;曲库丰富,歌曲更新快;资费低廉,付费灵活。 手机下载 电脑网站 下载 音乐随身听 渠道 歌曲下载业务渠道和资费 资费 手机访问移动梦网首页,进入“海量MP3歌曲” 或直接访问/music; 通过登录/,根据网站提示下载 下载音乐随身听客户端,实现对音乐的下载播放和管理 什么是歌曲下载业务? 单曲按次 下载 包月租赁 套餐 用户每下载一首歌曲,收取一次费用;在文件没有删除的情况下,用户购买的音乐可以无限制下载,1~3元/次 5元(包含可租赁50首歌曲下载) 10元(包含可租赁200首歌曲下载) 手机阅读业务发展目标 业务发展目标 提高业务收入 扩大用户规模 提高活跃 激活沉默 增加黏性 拉动新增 高活跃用户推荐客户端 已有用户推荐偏好内容 潜在用户推荐阅读业务 潜在用户挖掘流程 具体 内容 两个用户群的用户做对比分析,看有什么不同的用户特征 计算潜在用户推荐指数 按潜在用户推荐指数决定入选优先级别 目 的 逻辑回归模型简介 ◆ LOGISTIC回归模型的一种最简单形式即所谓的二分类变量回归模型 ◆相应变量是类如是否的一二分类变量(如是否流失、是否购买等) ◆连续概率转换函数为LOGISTIC函数,即: ◆采用极大似然方法获得相关参数的估计 ◆模型的统计诊断也主要包括模型的拟合优度诊断以及回归系数的显著性诊断两个方面 ◆ LOGISTIC回归的评分是利用新样本的变量取值,通过上述的方程式计算相应概率的过程,即: 其中: 逻辑回归模型定义 研究背景 建模过程 模型检验及应用 目录 研究方法 研究工具 使用clementine12.0完成选择变量和建模的过程。 对提取的15W用户数进行选择,选择全曲下载活跃用户5W用户,再选择不活跃的约10W用户,两者比例为1:2的样本,其中一份用于建立逻辑回归模型,得出逻辑回归计算公式用于预测;另一份用于根据逻辑回归模型进行虚拟的预测,将预测结果与实际情况进行比对以检验模型的准确性并优化模型。模型建成后对预测用户打分,从而选择优质用户。 研究方法与研究工具 模型优化 4 模型建立 3 变量筛选 2 数据预处理 1 数据需求分析 数据抽样提取和数据 核查 数据预处理 探索分析 建模属性分析 业务经验筛选 特征建模(卡方检验等)筛选 数据质量筛选 相关分析筛选 Wald显著性检验筛选 建立基于逻辑回归算法的潜在用户预测模型 建模方法选择:进入法,逐步法等 模型类型选择:主效应、全效应 测试预测模型预测效果 准确率 查全率 提升度 模型优化 属性分析方案优化 抽样比例优化 属性选择优化 逻辑回归的预测步骤 数据预处理步骤变量筛选及结果 业务经验筛选 特征建模筛选 数据质量筛选 相关分析筛选 Wald显著性筛选 1 2 3 4 5 终端是否支持JAVA 终端是否支持GPRS 终端信息 全曲下载业务字段选择 基本信息 ARPU 年龄 区域归属类型 是否集团成员 品牌 飞信用户标识 来电提醒用户标识 业务订购 MOU 新业务费 12530短信上行条数 彩铃下载次数 gprs流量费 WAP登陆次数 数据业务费用 消费行为 模型建立过程 使用Clementine进行字段处理,建立逻辑回归分析模型。 Clementine流如下: 模型建立过程 根据模型得出逻辑回归打分公式: 其中 α= (-0.650)*豫通卡+1.687*本地通+(-5.125)*标准神州行+(-1.085)*全球通(预付费)+(-1.283)*动感地带 +(-0.514)*神州行亲情卡+(-0.147)*神州行乡情卡+(-0.474)*神州行休闲卡+(-0.573)*神州行大众卡 +1.080*(来电提醒用户标示=1)+(-0.007)*(集团成员标识=1)+(-0.088)*(是否飞信用户=1) +(-0.357)*(终端是否支持JAVA=1) +0.190*(彩铃下载次数0 and 彩铃下载次数=10)+21.846*(彩铃下载次数10 and 彩铃下载次数=50)
文档评论(0)