从用数据到养数据.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从用数据到养数据   过去,有一些问题一直困扰着我:“现在的企业获取数据如此容易,数据的增长速度如此之快,那么对于企业来说,到底要收集什么样的数据?收集多少数据?收集数据的边界在哪里?”后来,我在美国遇到一位高人,他认为,过去收集数据很难,而现在获取数据资源变得越来越容易,但是如果收集数据的出发点不是为了解决问题,那么收集再多的数据也没有什么意义。   同时,许多企业还有一个疑问:“现在收集数据不难,成本也不高,为什么不先收集了数据再说呢?等以后需要数据来解决问题时,再拿出来用不是也可以吗?”这位高人同样也给出了这个问题的答案,他对此持否定观点,并指出用这样的理念来设计数据应用注定会失败。   数据收集是没有边界的,我为此也痛苦了好一段日子,比如,收集一个人的生日,虽然可以精确到几分几秒,但这么精确的数据又能用在什么领域,又能产生什么价值呢?   事实上,数据是有生命周期的。比如,某网站的母婴频道在主动收集用户的宝宝信息,包含宝宝生日、性别、小名、身高、体重,这里我们就要清楚这几个数据的用途和生命周期,如宝宝的身高和体重。但是,妈妈们填写的是宝宝当前的数据,我们知道宝宝的身高、体重变化非常之快,也就是说这两个数据的生命周期很短,在当时的推荐中可能有用,但过了一段时间后,这两个数据就失效(Data Broken)了;而宝宝生日和性别这两个数据的生命周期就很长,可以从生日的年份中推算出宝宝的年龄,而性别则基本是终生稳定的。   保存数据及其收集时的背景(Context),也是一件不容易的事情。   还是以收集宝宝的年龄作为例子来阐述,我们可以通过用户购买特定的商品集合,如几段奶粉和尿不湿的型号等,知道宝宝所处的大概年龄段,以推算出宝宝当前的年龄。但如果仅仅是保存宝宝几岁这个数据,那么这个数据很快也会失效,因为人的年龄是在动态变化的。同时,你还需要保存宝宝几岁这个数据获得的时间,即在哪年哪月计算得知这个宝宝的年龄,而这个信息就是背景数据。另一种做法更加聪明一些,即通过宝宝现在的年龄反过来推算宝宝是什么时候出生的。   所以说,在收集数据时,我们必须知道这些数据未来可以用来做什么,如果今天都想象不出来的话,日后就更不可能了。   打一个比方,如今很多电商高管会询问数据分析师商品的重复购买率是多少。于是,工作人员收集数据来计算重复购买率,却很少想到高管们需要重复购买率是来做什么决定的,这就好比“刻舟求剑”的故事。事实上,在世事多变的大数据时代,我们不能只是机械地套用方法或指标。   重复购买率有不同的定义,而做不同的决策需要考虑经过不同定义的重复购买率。如果一家投资公司想收购A 公司,那么会从重复购买率来看整个A 公司的运营良好程度或用户质量等;如果从A公司本身运营的角度来看重复购买率,那么它更应该关注的是日、周级别的重复购买率的变化趋势,或者当月新增客户有多少人在三个月后进行了重复购买,从而可以衡量出每个月新增及存量客户的忠诚度和质量,进而找出改善的空间。在知道了以上的背景之后,再去选择使用什么数据不是更有的放矢吗?   数据应用因小而美   “小”不是指数据量,而是指应用的目标很具体。   2011年年底,作为一名数据分析师,我开始思考怎么从“用数据”转变为“养数据”(即从数据化运营转变为运营数据),这段时间我为收集什么样的数据而特别烦恼。而且,我也曾经试图做出一个特别大且适合多数人使用的数据应用,可是后来发现这在数据应用的起步阶段几乎是不可能的―― 一是找到可以解决大部分人需求的数据应用并不容易;二是当时公司的数据非常丰富,需要考虑的因素很多,因素之间的联系又很复杂。   所以,当开发数据应用的时候,数据就等于原材料;当原材料一直处于变化的情况下,做出来的产品就很容易出问题。体会到数据和应用的关系之后,我最后决定从小角度切入,先把小应用做出来,这就是很好的瞄准器。   这里说的“小”指的是应用的目标很具体。请注意,“小”不是指数据量。许多人在没有获取足够的数据,并且缺乏对数据理解的情况下做出决策,其实是在“享受”自己的无知。打个比方来说,对于一款数据应用,如果我的目的是分辨两种决策谁更好以及差异在哪里,这就是一个很具体的问题;但如果我的目标是想知道如何让公司赢利,这就是一个空泛的目标。   经过这样的一番周折后,按照小角度切入的想法设计数据应用,就可以做得具体而快速,而且可以避免因原材料的变化而导致数据缺失的问题。   把数据放进“框”之中   在大数据的背景下,必须考虑数据之间的关联性。一个单独的数据是没有意义的,要把数据放在一个“数据框架”(场景)之中,才能看出存在的问题。   为了把这个问题说得更明白,这里我拿前阵子一家电商公司找我讨论的问题来举例。   A 公司问我,要不要撤去导航网

文档评论(0)

小马过河 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档