光环大数据写给喜欢数据分析初学者.pdfVIP

  • 3
  • 0
  • 约6.35千字
  • 约 7页
  • 2018-06-09 发布于湖北
  • 举报

光环大数据写给喜欢数据分析初学者.pdf

光环大数据--大数据培训知名品牌 光环大数据写给喜欢数据分析的初学者 一、数据分析师有哪些要求? 1、理论要求及对数字的敏感性,包括统计知识、市场研究、模型原理等。 2、工具使用,包括挖掘工具、数据库、常用办公软件(excel、PPT、word、 脑图)等。 3、业务理解能力和对商业的敏感性。对商业及产品要有深刻的理解,因为 数据分析的出发点就是要解决商业的问题,只有理解了商业问题,才能转换成数 据分析的问题,从而满足部门的要求。 4、汇报和图表展现能力。这是临门一脚,做得再好的分析模型,如果不能 很好地展示给领导和客户,成效就大打折扣,也会影响到数据分析师的职业晋升。 二、请把数据分析作为一种能力来培养 从广义来说,现在大多数的工作都需要用到分析能力,特别是数据化运营理 念深入的今天,像BAT 这样的公司强调全员参与数据化运营,所以,把它作为一 种能力培训,将会让你终生受益。 三、从数据分析的四个步骤来看清数据分析师需具备的能力和知识: 数据分析的四个步骤(这有别于数据挖掘流程:商业理解、数据理解、数据 准备、模型搭建、模型评估、模型部署),是从更宏观地展示数据分析的过程: 获取数据、处理数据、分析数据、呈现数据。 (一)获取数据 获取数据的前提是对商业问题的理解,把商业问题转化成数据问题,要通过 现象发现本质,确定从哪些纬度来分析问题,界定问题后,进行数据的采集。此 环节,需要数据分析师具备结构化的思维和对商业问题的理解能力。 推荐书籍:《金字塔原理》、麦肯锡三部曲:《麦肯锡意识》、《麦肯锡工具》、 《麦肯锡方法》 工具:思维导图、mindmanager 软件 (二)处理数据 光环大数据 光环大数据--大数据培训知名品牌 一个数据分析项目,通常数据处理时间占70%以上,使用先进的工具有利于 提升效率,所以尽量学习最新最有效的处理工具,以下介绍的是最传统的,但却 很有效率的工具: Excel:日常在做通报、报告和抽样分析中经常用到,其图表功能很强大, 处理10 万级别的数据很轻松。 UltraEdit:文本工具,比TXT 工具好用,打开和运行速度都比较快。 ACCESS:桌面数据库,主要是用于日常的抽样分析(做全量统计分析,消耗 资源和时间较多,通常分析师会随机抽取部分数据进行分析),使用SQL 语言, 处理100 万级别的数据还是很快捷。 Orcle、SQLsever:处理千万级别的数据需要用到这两类数据库。 当然,在自己能力和时间允许的情况下,学习新流行的分布式数据库及提升 自身的编程能力,对未来的职业发展也有很大帮助。 分析软件主要推荐: SPSS 系列:老牌的统计分析软件,SPSSStatistics (偏统计功能、市场研 究)、SPSSModeler (偏数据挖掘),不用编程,易学。 SAS:老牌经典挖掘软件,需要编程。 R:开源软件,新流行,对非结构化数据处理效率上更高,需编程。 随着文本挖掘技术进一步发展,对非结构化数据的分析需求也越来越大,需 要进一步关注文本挖掘工具的使用。 (三)分析数据 分析数据,需要用到各类的模型,包括关联规则、聚类、分类、预测模型等, 其中一个最重要的思想是对比,任何的数据需要在参照系下进行对比,结论才有 意义。 推荐的书籍: 1、《数据挖掘与数据化运营实战,思路、方法、技巧与应用》,卢辉著,机 械出版社。这本书是近年国内写得最好的,务必把它当作圣经一样来读。 2、《谁说菜鸟不会数据分析(入门篇)》和《谁说菜鸟不会数据分析(工具 篇)》,张文霖等编著。属于入门级的书,适合初学者。 光环大数据 光环大数据--大数据培训知名品牌 3、《统计学》第五版,贾俊平等编著,中国人民大学出版社。比较好的一

文档评论(0)

1亿VIP精品文档

相关文档