干货分享 :数据分析架构及方法.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
干货分享 :数据分析架构及方法

干货分享 :数据分析架构及方法   今天很高兴能够与大家做一次针对数据分析的分享。我以数据分析人员的身份,曾参加过数次的数据分析项目,在这些项目中也间接地参与了大数据系统的搭建,今天也是希望能够跟大家聊一聊我对数据分析的一些想法。   一、以往的数据分析在今天的各类型企业中,数据分析岗位已经基本得到普及和认可,这个岗位的核心任务往往是支撑运营和营销,将企业内部的数据,客户的数据进行分析和总结,形成以往工作情况的量化表现,以及客户的行为趋势或特征等。   如果从更宏观的角度来认识数据分析岗位的话,每一个数据分析人员都明白,其实数据分析岗位要达到的目标就是希望通过数据来发现潜在的规律,进而帮助预测未来,这一点同数据挖掘的目标一致。那么为什么在大多数公司都已经具备的数据分析岗位基础上,今天却还是在反复提到数据挖掘这个概念,我们就需要来看看数据分析都有哪些是没有做到的内容。   1数据分散多数数据分析岗位在公司中的岗位设置是隶属在单一业务部门中作为一个支撑岗,只有少数的公司是将数据分析作为一个独立的部门。其差异性在于,前者的数据分析所能分析的内容仅限于自身部门所输出的指标,比如投诉部门只看投诉处理过程中的数据,销售部门只看销售过程中的数据,一旦涉及到需要将各类指标汇总分析的情况,这种组织架构就会带来极大的负面影响,由于不同部门具备自己部门指标导出的权限,且与其他部门的配合并不影响绩效任务,所以这种跨部门采集数据的过程往往效率奇低。而数据分析最关键的就在于汇集更多的数据和更多的维度来发现规律,所以以往的数据分析多是做最基础的对比分析以及帕累托分析,少有使用算法来对数据进行挖掘的动作,因为越少的指标以及越少的维度将会使得算法发挥的效果越差。   2指标维度少在以往的企业中,数字化管理更多的体现在日常运维工作中,对于客户端的数据采集虽然从很早以前就已经开展,CRM系统的诞生已经有很久的时间了,但是一直以来客户端的数据维度却十分缺失,其原因在于上述这些途径所获得的数据多为客户与企业产生交互之后到交互结束之间的数据,但是这段时间只是这个客户日常生活中很少的一部分内容,客户在微博,微信上的行为特点,关注的领域或是品牌,自身的性格特点等,可以说一个客户真正的特点,习惯,仅通过与企业的交互是无从知晓的,因此难以挖掘出有效的结论。   3少使用算法在上述制约条件下,可想而知数据分析人员对于算法的使用必然是较少的,因为数据分析依赖于大量的指标、维度以及数据量,没有这三个条件是难以发挥算法的价值的,而在排除掉算法后,数据分析人员更多的只能是针对有限的数据做最为简单的分析方法,得出浅显易懂的分析结论,为企业带来的价值则可以想象。   4数据分析系统较弱目前的数据分析多采用excel,部分数据分析人员能够使用到R或SPSS等软件,但当数据量达到TB或PB单位级别时,这些软件在运算时将会消耗大量时间,同时原始的数据库系统在导出数据时所花费的时间也是相当长的,因此对大数据量的分析工作,常规的系统支撑难以到达要求。   二、技术革命与数据挖掘   得益于互联网对于人们生活的影响逐渐增大,我们发现数据正在疯狂的增长。今天一个人一天的时间中有将近一半是在互联网中度过的,一方面这些使用互联网的交互都是能够被捕捉记录的,一方面由于碎片化时间的使用,客户与企业交互的机会也变的越来越频繁,进一步保障了客户数据的丰富。同时在大数据技术的支撑下,今天的系统能够允许对这些大规模的数据量进行高效的分析。   因此数据分析人员也能够开始使用一些较为抽象的算法来对数据做更为丰富的分析。所以数据分析正式进入到了数据分析的时代,也就是数据挖掘的时代了。   三、数据处理流程数据分析也即是数据处理的过程,这个过程是由三个关键环节所组成:数据采集,数据分析方法选取,数据分析主题选择。这三个关键环节呈现金字塔形,其中数据采集是最底层,而数据分析主题选择是最上层。   四、数据采集   数据采集即是如何将数据记录下来的环节。在这个环节中需要着重说明的是两个原则,即全量而非抽样,以及多维而非单维。今天的技术革命和数据分析主要就是体现在这个两个层面上。   1全量而非抽样由于系统分析速度以及数据导出速度的制约,在非大数据系统支撑的公司中,做数据分析的人员也是很少能够做到完全全量的对数据进行收集和分析。在未来这将不再成为问题。   2多维而非单维另一方面则在于数据的维度上,这在前边同样提及。总之针对客户行为实现5W1H的全面细化,将交互过程的什么时间、什么地点、什么人、因为什么原因、做了什么事情全面记录下来,并将每一个板块进行细化,时间可以从起始时间、结束时间、中断时间、周期间隔时间等细分;地点可以从地市、小区、气候等地理特征、渠道等细分;人可以从多渠道注册账号、家庭成员、薪资、个人成长阶段等细分;原因可以

文档评论(0)

jixujianchi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档