- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实战:如何做好数据分析让运营效率提高100倍?
论文类别:计算机 - 互联网研究
上传时间:2015/12/9 12:19:00
论文作者:未知
(中讯)大家好,今天晚上很高兴来到馒头商学院,跟大家分享一些做互联网
产品的一些心得,特别是数据分析方面的心得体会、还有一些教训和经验。
1、第一个故事
我先跟大家分享两个故事。第一个故事是关于 “中国股票研究中心”的故
事。故事是这样的,1月2号的时候,有一个人叫Peter,Peter收到一封来自
“中国股票研究中心”的邮件,向他表示这个月市场会上涨。结果市场果然上
涨,前段时间股票不错,很多人不知道在座的大家有多少买过股票。然后
Peter收到这封邮件的时候,他不是很在意,因为大家都知道所谓的元月效应
这回事,即好几年来都是一月份的股价涨的多。到了2月1号的时候,他又收
到另外一封邮件,向他表示市场即将下跌,这一次,那封信又给说中了!Peter
现在终于开始相信这个研究中心真的是有点水平。3月1号的时候,Peter又收
到一封信,情形还是一样的。
Peter觉得很神奇,他主动联系对方,希望下个月还能收到同样的邮件,过
了一个月,4月1号邮件如期而至,但这时候这个研究中心表示,前几封邮件
预测太准了,结果引起了证监会的高度重视,他们以后不能再像以前那样大规
模的免费发送邮件了,只能对少数有见识的VIP客户提供投资建议,而你是非
常幸运的一名,获得了有限的100个VIP购买资格。
你是怎么看待这个“中国股票研究中心”呢?
A、这个肯定是有内幕的,否则怎么可能预测得这么准呢?
B、世界上什么样的人物都有,估计真的是预测水平高吧。
C、不知道怎么回事,既然这么准,要不买个VIP资格试试吧!
连续几次收到这样的邮件,我觉得要是换作在座的任何一个人,估计都会很
心动。真实的情况是这样的,这个所谓的 “中国股票研究中心”,他向市场上
的非特定对象群发了大概1000封的邮件,然后把这1000封里面分为2组,一
组是说告诉他接下来股票会涨,另一组告诉他会跌,每次发送的时候,总有一
半的人是收到预测是准的邮件,而另一半的人可能就收到预测是错误的邮件。
接下来循环同样发送几次之后,可能每次连续几次总有几个人收到的邮件是始
终预测正确的,而Peter就是那个始终预测正确中的一个用户。
这样的案例可能大家在其他地方也看到过。他告诉我们一个道理,即在数据
分析中你有时候会看到一些数据很稳定地朝一个方向变化,并不一定代表着真
相就是这样的。
2、第二个故事
第二个故事,这个故事发生在二战时候。英国,当时盟军跟德军在英国上空
进行了惨烈的空战。但是发现空战的结果是盟军受到很大的损失,所以盟军就
希望在自己的战斗机上增加一些装甲保护,但是大家都知道飞机的装甲是不可
能无限制的加的,因为装甲越多,飞机一定是飞得越慢,然后耗油量越大。于
是,空军就请来一些专业的统计学家、数学家,一起来分析看看能从现有的飞
机的数据上看看在那些部位增加装甲是最划算的。
这个故事的主人公沃德教授就跟空军一起来到了维修基地,大家做了一轮统
计下来之后,发现所有盟军正在维修基地中维修的轰炸机的机翼上,弹孔是分
布的最多。但是发动机舱跟驾驶员座舱的弹孔数是最少的。于是,空军就比较
倾向于希望能够加强机翼部分的装甲。在这个时候统计学家就有了跟那个空军
完全不一样的看法,沃德教授就建议,他觉得应该是加强飞行员座舱跟发动机
舱的装甲,因为那里发现的弹孔最少。
如果是你,你是同意沃德教授的看法呢还是同意空军的看法?我给出的答案
是说我同意统计学家的看法,因为这里涉及到我们数据分析中的一个 “幸存者
偏差”。大家可以看到,虽然我们统计下来是那个机翼上中弹是最多的,但是
实际上大家不要忘了这里我们所选取的样本并不是所有参与战斗任务的所有的
轰炸机,而只是在维修基地中这些能够幸存下来的飞机。实际上我们在战斗过
程中大量损失的飞机并没有在这个维修基地中出现,可能在空中就爆炸了或者
怎样。
统计学上把这个叫做 “幸存者偏差”。因为我们在分析数据样本的时候,只
关注那些幸存者的数据。所以这个故事也告诉我们一个道理,做数据分析中选
择样本是非常重要的。你如果只看到幸存者的样本,导出来的数据跟结论就是
有偏差的。
前面讲的这几个案例可能跟我们的互联网产品工作都相差比较远。但是,统
计分析的道理不仅是在我们的产品设计中有用,实际上在我们工作生活的方方
面面,我们只要带着数据分析的思维,很多情况下都是非常实用的。
3、如何判断竞争对手数据的真实性?
接下
文档评论(0)