《数据挖掘在电子渠道分流模型中的应用研究》-毕业论文.docVIP

下载本文档

2
0
约2.76千字
约 6页
2018-11-15 发布于广西
举报
版权申诉

《数据挖掘在电子渠道分流模型中的应用研究》-毕业论文.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

w 数据挖掘在电子渠道分流模型中的应用研究摘要：针对中国移动战略转型到全业务运营和大力发展电子渠道的契机，提出了构建电子渠道分流模型，通过实证该模型具有较广泛的应用价值。关键词：数据业务；电子渠道；关联算法；逻辑回归 1 引言中国移动数据业务的发展方式主要是通过对单个数据业务进行营销或交叉销售，以增加订购的用户数。然而，对单个数据业务做营销有两个缺陷：一是不同的数据业务营销会对用户产生重复的打扰，浪费和用户接触的机会。二是不同数据业务的营销推广会浪费营销资源，随着数据业务的增加，成本增加较多。因此，本文提出的电子渠道分流模型是以用户方便办理数据业务为中心，优化原有电子渠道用户，挖掘潜在用户，合理分配电子渠道。 2 模型建立电子渠道分流模型是通过分析挖掘出与客户匹配的业务和渠道，即将适宜的产品，通过适宜的渠道，在适宜的时机，营销给适宜的客户。电子渠道分流模型包括两部分，一是客户与产品推荐模型，通过挖掘客户的潜在需求，建立业务推荐模型，为客户提供最适宜的产品；二是客户与电子渠道内部各渠道的推荐模型，通过对客户属性、行为分析、渠道使用特征等的深入挖掘，建立渠道偏好模型，为客户找到最优的渠道，随着标签库的积累，逐渐形成特定的电子渠道营销用户群。 2.1 业务推荐模型业务推荐模型的基本思路是对处于不同生命周期的数据业务采用不同的推荐方式。成长期和成熟期的业务用apriori关联算法进行推荐，apriori算法的核心依据频繁项集产生相应的关联规则。导入期的业务用户数少，关联算法无法体现其中的规则，但数据业务产品间存在互补或互斥的关系，通过构建类型偏好模型进行推荐。 2.2 渠道偏好模型使用电子渠道的潜在用户增多，为缓解实体渠道的压力，需要对用户使用渠道偏好进行细分。为选择出最适合的渠道，需要比较不同渠道使用的可能性，本文使用模型为二元分类logistic回归模型可预测分类变量发生的概率。 3 实证分析本文基于中国移动某省分公司的业务数据，该省重点推广的数据业务有11种，分别是s1：彩铃、s2：无线音乐俱乐部、s3：飞信、s4：手机邮箱、s5：手机证券、s6：天气预报、s7：手机报、s8：手机视频、s9：手机游戏、s10：号簿管家、s11：来电提醒。为便于尽可能多的发现其中的规则，随机抽取200万用户作为建模的样本，但需要剔除重入网客户、渠道养卡客户和非真实数据业务使用客户三类客户，此三类客户在数据库中已做标识，最终保留了1818179个用户数据。为尽可能多的发现其中的订购规则，设定前项的最小用户数为1000，相应的支持度为0.055%（即1000/1818179）。为尽可能多的输出关联规则，置信度设置为1%。设置前项个数为最多11项，表示可根据用户对11项业务的使用情况来进行预测。通过分析可以看出，在样本用户中有0.078%的用户同时使用了手机邮箱、号簿管家这两个业务。在同时使用手机邮箱、号簿管家用户中，有38.43%的用户同时也是手机证券使用的用户，即规则的置信度为38.43%。关联模型给用户推荐的指数，只有在超过一定的界限后，推荐给用户成功的几率才会变大，通过计算得到其他11项业务的阈值，根据阈值确定候选用户数、筛选用户数，根据1月份实际的新增的情况，计算出新增用户数，通过筛选用户数和新增用户数的交集，可以计算出预测准确数，从而得出筛选用户比例、查全率和提升度，通过计算各业务的查全率和提升度可知，模型总体效果较好，对业务进行汇总，模型筛选了22.5%的候选用户，查全率为62.6%，提升倍数为2.8倍。模型对彩铃、飞信等成熟型业务预测效果很好，查全率较高，提升效果明显。但是手机视频、手机游戏等导入期业务由于活跃用户少，关联关系未体现出来，模型查全率较低，需要根据类型偏好模型为予以完善。根据业务属性和所满足的用户需求将新业务分为四类，并确定每一个业务的具体评分指标。根据业务使用程度进行打分可计算类型偏好得分。根据类型偏好得分，对模型进行评估，将2011年1月新增用户与类型偏好模型在一定阈值上的预测用户进行比对，得到模型的查全率、提升度等。虽然模型总体效果不如关联模型，但模型对于手机视频、手机游戏等导入期业务，查全率提升明显，可对关联模型进行有效的修正。类型偏好模型挖掘了同类型业务之间的关系，通过定性和定量分析的结合，对导入期业务预测效果好于关联规则模型。数据业务关联模型和类型偏好模型都是反映了数据业务之间的关联关系，类型偏好模型弥补了关联模型不能反映导入期业务之间关系的不足，因此可把两个模型结合起来构建数据业务推荐模型。把关联模型的推荐指数和类型偏好的得分标准化后，通过因子分析构建业务推荐模型，通过分析，业务推荐模型效果好于单一的关联模型和类型偏好模型。渠道偏好模型的构建过程：第一，选取数据，从后台数据