(完整版)数据分析需要掌握哪些技能.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据分析需要掌握哪些技能? 想知道数据分析需要掌握哪些技能?我们先来了解一下 数据分析过程吧。 数据分析工作 大致由以下六阶段组成: 1 、理解需求 2、获取数据 3、数据预处理 4、统计分析 5、数据 建模 6 、数据可视化及分析报告撰写。 业务理解  数据获取  数据预处理 可视化及报告 数据建模 统计分析 除了理解需求阶段不需要技术性技能外其余每个阶段都会涉及到或多或少的技能, 下面 我帮大家梳理一下。 1.理解需求 数据分析首先要做的就是理解需求,知道要做什么,然后才能考虑怎么做。 理解需求需要有一定的业务经验,其他技能并不会涉及太多。 获取数据 理解需求之后大致可以确定需要什么样的数据了,接下来就是获取数据。 获取数据一般需要这几个技能 1、 数据库( SQL)技能 一般注重数据积累的公司都有自己的数据仓库, 大部分数据可以直接拿来做数据分析, 所以你需要 SQL 技能去完成数据提取等数据库管理工作。 2、 网络爬虫技能 还有一些是公司不具备的数据, 需要到互联网上爬取。 这用到的就是网络爬虫技术, 爬 虫涉及到 HTML 、http 、JavaScript、CSS 等知识, 所有可以用来开发 web 服务的编程语 言都可以用来开发爬虫程序,如 python 、Java、c/c++ 、JavaScript(nodejs )等。爬虫 技术比较复杂,简单工作可由数据分析师自己完成,但复杂的爬取任务一般是由分析 师提需求技术部门来完成的。 3.数据预处理 拿到手的数据一般是有各种各样的问题,如:缺失、异常(取值超出常识) ,异构等。这 样是不能直接用来分析与建模的,需要进行必要的清理、修整、整合、规范化、重塑、切片 切块、变形等处理以便进行分析。 因此需要掌握几种数据处理工具, 常见的数据预处理工具有 excel、SQL、python 等语言 或工具。这几种工具的使用场景有些差异: excel 可以处理数据量不大,且没有太多复杂的字符结构的数据。 SQL 可以处理数据量大但是结构简单的数据。 Python 结合 pandas 、numpy 库来使用,适合用来处理结构比较复杂的数据。当然结构 简单的数据处理起来更轻松了。 如果数据量特别大,那还需要掌握在大数据平台的使用方法,如  Hadoop  、 spark  等。 4.统计分析 数据预处理完成之后就可以对数据做一些统计分析了,如根据分组变量对数据集进行聚 合计算、求均值、求和、求方差标准差等度量指标计算。还可以对某些特征之间进行相关性分析、列联分析、各种假设检验,通过多种方式以探索数据间的关联。 统计分析需要具备数理统计知识并掌握统计工具 SPSS、SAS或编程语言如 python 、R 等。 5.数据建模 在定性的理解数据之后想要量化的找出数据之间的关系,方便做出预测或者分类。这就需要通过数据结合统计算法、机器学习算法来训练出模型。 数据建模需要具备统计知识、熟悉机器学习算法并有一定的编程能力。数据建模常用的 模型有线性回归、逻辑回归、决策树、随机森林、支持向量机( svm)、神经网络。这些模型大部分都可以在 python 的第三方库 Scikit-learn 中发现 ,因此 python 编程也是必不可少的技能。 6.数据可视化及数据报告的撰写 数据可视化展示与数据报告的撰写是数据分析必不可少的步骤。 数据可视化的工具比较 多,可以用 excel 、tableau 、R 、python 等,工具掌握一种或两种即可。数据可视化不仅需 要掌握一定的可视化工具用法, 还需掌握数理统计知识。 只有掌握了统计知识、 理解数据才 可以设计出合适的图形来展示结果。 数据分析报告则需要掌握业务知识和统计知识, 两者结 合才能很好的解读出分析结果的含义。 综上与数据分析相关的技能还是蛮多的, 首先要掌握统计及相关数学理论、 再有就是熟 悉 SQL 、python 、R 、 SPSS 等语言工具。其中有些技能从功能上来讲是重叠的,如 R 和 python  。具体使用哪种要根据公司要求及个人习惯来选择。

文档评论(0)

152****6621 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档