数据分析基础—基于Excel和SPSS(高职经济管理类专业)全套教学课件.pptx

数据分析基础—基于Excel和SPSS(高职经济管理类专业)全套教学课件.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;;学习目标;;导入案例;模块一;是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大程度地开发数据资料的功能,发挥数据的作用。数据分析离不开数据的支持,它是对数据的汲取。;模块一数据分析的概念;模块一数据分析的概念;;模块一数据分析的概念;模块一数据分析的概念;模块二;;模块二数据分析的步骤;项目的整体框架;模块二数据分析的步骤;;数据搜集;获取数据的方式有很多,根据不同的需要有不同的获取途径,像市场调查、专业网站、公开出版物等。;数据预处理;;;;;;;数据分析;;数据展现;报告撰写;在分析报告中,每一个问题必须要有明确的结论,一个分析对应一个结论,切忌贪多,结论应该基于严谨的数据分析,不能主观臆测。

同时,分析报告应该通俗易懂,使用图表和简洁的语言来描述,不要使用过多的专业名词,要让看报告的人能够看懂,从而产生思考。;模块三;根据使用的工具和理论的难度,可将常用的数据分析方法分成4类:;单纯的数据加工方法;该方法通常是从企业的管理信息数据库系统或数据仓库中,对相关数据进行提取、加工、衍生处理和生成各种业务报表。;1.描述性统计分析;;描述性统计分析可分为集中趋势分析、离中趋势分析和数据分布分析。;2.相关分析;数理统计分析方法;1.方差分析;2.回归分析;3.因子分析;数据挖掘方法;;1.聚类分析;;2.分类分析;3.关联规则;应用关联规则最经典的案例就是购物篮分析,通过分析顾客购物篮中商品之间的关联,可以挖掘顾客的购物习惯,从而帮助零售商更好地制定有针对性的营销策略。;在众多的关联规则数据挖掘算法中,最著名的是Apriori算法。关联规则算法不但在数值型数据集的分析中有很大用途,而且在纯文本文档和网页文件中也有着重要用途。比如发现单词间的并发关系及Web的使用模式等,这些都是Web数据挖掘、搜索及推荐的基础。;4.回归分析;数理统计分析方法;在大数据时代,大数据技术要解决两个重要的难题:一是要解决海量数据在多台机器上的存储;二是要解决如何对多台机器上存储的数据进行分析。大数据技术的基本原理还是聚类、分类、主题推荐等数据挖掘的内容,在基于大数据的数据分析方法中,有很多方法都是对原有数据挖掘算法的改进,将原来单机实现的算法改成多台机器的分布式计算。

简单地说,基于大数据的数据分析方法就是分析工具不一样的数据挖掘分析方法,有的也加入了数理统计的思想,它无法使用SPSS,SAS等单机数据分析工具来完成,其分析工具一般都需要具备分布式计算的能力。大数据分析常用的工具有Hadoop,Spark,Storm等。;Hadoop是一个能够对大量数据进行分布式处理的软件框架。但Hadoop是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop还是可伸缩的,能够处理PB级数据。此外,Hadoop依赖于社区服务器,因此它的成本比较低,任何人都可以使用。;2.大数据分析的“瑞士军刀”——Spark;3.实时大数据处理工具——Storm;数据分析人员应对上述每种不同的数据分析方法都要了解,因为不同的数据分析方法适用的场景是不一样的,能解决的数据分析目标也是不一样的。;;;;;学习目标;;导入案例;导入案例;导入案例;导入案例;导入案例;导入案例;导入案例;模块一;统计数据搜集是根据统计研究预定的目的要求和任务,运用相应的科学的方法和手段,有计划、有组织地向客观实际搜集资料的过程。从统计工作过程的阶段性来看,统计数据的搜集处于统计工作过程的基础阶段。;统计数据的来源和搜集方法;;2.统计数据的搜集方法;直接观察法收集的信息由调查人员边观察边记录,因此真实可靠,数据的准确性较高;由于调查人员不是强行介入对象行为发生过程,能够在被调查者不察觉的情况下获得资料。但是直接观察法搜集资料需要花费较多的人力、物力和时间,因此它的运用受到一定的限制,一般在对调查结果的准确性要求较高、对已有的信息存在疑问或只能用直接观察法获得信息时使用。;②报告法。报告法也称为报表法,一般是由统计工作机构将调查表格分发给被调查者,被调查者则根据原始记录和核算资料,按填报的要求和呈报程序提供资料的方法。这种方法是我国政府统计的传统方法,目前各行各业提供统计报表、经济实体每月报送的纳税申报表等,就是一种报告法。;;③面谈访问法。面谈访问法是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。面谈访问法可进一步分为入户访问和街上拦截访问两种。;;④邮寄访问法。邮寄访问法是指调查者与被调查者没有直接的语言交流,通过

文档评论(0)

163 + 关注
实名认证
内容提供者

知识分享

1亿VIP精品文档

相关文档