- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
常用的数据分析方法及案例吴志坚2011-7-26目录
1、分析思路
2、报表分析
3、在A/B测试
4、用户数据画像
分析思路
业务导向(目标和方法关系)
结果完整(体检报告:结论,数据,分析,建议)
螺旋上升
逻辑严密测试你的逻辑:
抽样问题:电信12580客户细分项目。项目目标:电信想具体分析12580的客户特征(如性别比例;使用12580频次等)。数据基本情况如下:2千万不同客户(电话号码)产生全量1亿条电话记录。抽样方法如下:从1亿记录随机抽取2万条电话记录,发现里面包含1.9万客户(电话号码)。这1.9万客户对应全量记录里面一共产生100万条电话记录,用这100万条电话记录构成抽样分析的样本。请问上述抽样是否有问题?问题出在哪里?如何解决?回答要点:抽样后样本平均每个用户有50条电话记录,不符合实际情况(全量样本中平均每个用户有5条电话电话记录)。原因主要是这个抽样方法是针对于电话记录的随机,对用户不随机(多电话记录的用户被抽中的可能性大)。正确抽样方法是:从全量记录里面抽取全量不同的用户,然后在用户里面随机抽取2万用户,在用这2万用户去匹配电话记录,构成样本。数据敏感!目标明确!逻辑严密!报表分析:简单!有效!用户是否使用soso和年龄有关么?
结论:有关系;从年龄分布上看,小于18岁用户中不活跃用户的占比最大;而用户的年龄越大,重度活跃用户的比例越高。说明:
1、a/btest:为了验证某种方案是否更优,采取分组测试方法。2、如何保证测试有效性:参照系稳定,数据充分。3、测试指标:不仅仅是数量,还有质量。4、联盟网吧案例:各个联盟网吧的分组指标如下:分组:识别差异!分析差异!优化!用户画像
1、画像对象:qq用户;2、通过qq号码,将用户的属性和行为关联起来;寻找用户的特征;3、数据只有对比才能说明问题:给数据寻找参照系;网吧用户画像
1、背景:了解网吧用户特征,用以网吧联盟战略参考;2、通过qq号码,判断用户是否在网吧ip登录;3、部分特征如下:2011年2月全量网吧用户1.43亿。qq用户约6.6亿。其中男性70%,女性30%,男女比例显著高于腾讯全量用户(2011年1月数据,男56.2%、女42.9%);网吧整体用户年龄分布与腾讯总体相比更加年轻,24岁以下用户占78%,腾讯全量用户为53.5%(2011年1月数据)。量大!男性化!年轻化!如何应用特征?ThanksQA
文档评论(0)