- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据如何驱动产品和运营?
一、大数据思维
在 2011 年、 2012 年 大数据概念火了之后,可以说这几年许多传统企业也好,互联网企业也好,都
把自己的业务给大数据靠一靠,并且提的比较多的大数据思维。
那么大数据思维是怎么回事?我们来看两个例子:
【案例 1 :输入法】
首先 ,我们来看一下输入法的例子 .我 2001 年 上大学,那时用的输入法比较多的是智能 ABC ,还有微
软拼音,还有五笔 .那时候的输入法比现在来说要慢的很多,许多时候输一个词都要选好几次,去选
词还是调整才能把这个字打出来,效率是非常低的。
到了 2002 年, 2003 年 出了一种新的输出法 —— 紫光拼音,感觉真的很快,键盘没有按下去字就已
经跳出来了。但是,后来很快发现紫光拼音输入法也有它的问题,比如当时互联网发展已经比较
快了,会经常出现一些新的词汇,这些词汇在它的词库里没有的话,就很难敲出来这个词。
在 2006 年 左右,搜狗输入法出现了。搜狗输入法基于搜狗本身是一个搜索,它积累了一些用户输
入的检索词这些数据,用户用输入法时候产生的这些词的信息,将它们进行统计分析,把一些新的
词汇逐步添加到词库里去,通过云的方式进行管理。
比如,去年流行一个词叫 然并卵“ ”,这样的一个词如果用传统的方式,因为它是一个重新构造的词
,在输入法是没办法通过拼音 “ran bing luan直接把它找出来的。然而,在大数据思维下那就不一”
样了,换句话说,我们先不知道有这么一个词汇,但是我们发现有许多人在输入了这个词汇,于是
,我们可以通过统计发现最近新出现的一个高频词汇,把它加到司库里面并更新给所有人,大家在
使用的时候可以直接找到这个词了。
二、数据驱动
对于数据驱动这一点,可能有些人从没有看数的习惯到了看数的习惯那是一大进步,是不是能看几
个数这就叫数据驱动了呢?这还远远不够,这里来说一下什么是数据驱动?或者现有的创业公司在
进行数据驱动这件事情上存在的一些问题。
一种情况大家在公司里面有一个数据工程师,他的工作职责就是跑数据。
不管是市场也好,产品也好,运营也好,老板也好,大家都会有各种各样的数据需求,但都会提
给他。然而,这个资源也是有限的,他的工作时间也是有限的,只能一个一个需求去处理,他本身
工作很忙,大家提的需求之后可能并不会马上就处理,可能需要等待一段时间。即使处理了这个
需求,一方面他可能数据准备的不全,他需要去采集一些数据,或做一些升级,他要把数据拿过来
。拿过来之后又在这个数据上进行一些分析,这个过程本身可能两三天时间就过去了,如果加上等
待的时间更长。
对于有些人来说,这个等待周期太长,整个时机可能就错过了。比如,你重要的就是考察一个节日
或者一个开学这样一个时间点,然后想搞一些运营相关的事情,这个时机可能就错过去了,许多人
等不到了,有些同学可能就干脆还是拍脑袋,就不等待这个数据了。这个过程其实就是说效率是非
常低的,并不是说拿不到这个数据,而是说效率低的情况下我们错过了很多机会。
对于还有一些公司来说,之前可能连个数都没有,现在有了一个仪表盘,有了仪表盘可以看到公司
上个季度、昨天总体的这些数据,还是很不错的。
对老板来说肯定还是比较高兴,但是,对于市场、运营这些同学来说可能就还不够。
比如,我们发现某一天的用户量跌了 20% ,这个时候肯定不能放着不管,需要查一查这个问题出
在哪。这个时候,只看一个宏观的数那是远远不够的,我们一般要对这个数据进行切分,按地域、
按渠道,按不同的方式去追查,看到底是哪少了,是整体少了,还是某一个特殊的渠道独特的地方
它这个数据少了,这个时候单单靠一个仪表盘是不够的。
理想状态的数据驱动应该是怎么样的?就是一个自助式的数据分析,让业务人员每一个人都能自己
去进行数据分析,掌握这个数据。
前面我讲到一个模式,我们源头是一堆杂乱的数据,中间有一个工程师用来跑这个数据,然后右边
是接各种业务同学提了需求,然后排队等待被处理,这种方式效率是非常低的。理想状态来说,我
们现象大数据源本身整好,整全整细了,中间提供强大的分析工具,让每一个业务员都能直接进行
操作,大家并发的去做一些业务上的数据需求,这个效率就要高非常多。
三、数据处理的流程
大数据分析这件事用一种非技术的角度来看的话,就可以分成金字塔,自底向上的是三个部分,第
一个部分是数据采集,第二个部分是数据建模,第三个部分是数据分析,我们来分别看一下。
【数据采集】
首先来说一下数据采集,
文档评论(0)