数据分析基础——Excel实现教学课件1.pptxVIP

  • 9
  • 0
  • 约1.76千字
  • 约 15页
  • 2022-06-13 发布于广东
  • 举报

数据分析基础——Excel实现教学课件1.pptx

课程结构 第1章 数据分析概述 第2章 数据处理 第3章 数据可视化分析 第4章 数据的描述分析 第5章 推断分析基本方法 第6章 相关与回归分析 第7章 时间序列分析;;学习目标 理解变量和数据的概念,掌握数据分类 了解数据来源和概率抽样方法 使用Excel抽取随机样本和产生随机数 思政目标 数据分析是一门应用性学科。思政建设应强调数据分析方法在反映我国社会主义建设成就中的作用 结合实际问题学习数据分析中的基本概念。结合数据来源和渠道,学习获取数据过程中可能存在的虚假行为,强调数据来源渠道的正当性以避免虚假数据 避免收集危害社会安全的非正当来源数据; 1.1 数据分析概述;从分析目的看 可以将数据分析分为描述性分析(descriptive analysis)、探索性分析(exploratory analysis)和验证性分析(confirmatory analysis)三大类。其中,描述性分析和是对数据进行初步的整理、展视和概括性度量,以找出数据的基本特征;探索性分析侧重于在数据之中发现新的特征,为形成某种理论或假设而对数据进行的分析;验证性分析则侧重于对已有理论或假设的证实或证伪。 从所使用的统计分析方法看可大致可分为描述统计(descriptive statistics)和推断统计(inferential statistics)两大类。描述统计主要是利用图表形式对数据进行汇总和展示,计算一些简单的统计量(诸如比例、比率、平均数、标准差等)进行分析。推断统计主要是根据样本信息来推断总体的特征,内容包括参数估计和假设检验等。参数估计是利用样本信息推断所关心的总体特征,假设检验则是利用样本信息判断对总体的某个假设是否成立;商业软件——不推荐使用 商业类软件种类繁多,较有代表性的软件有SAS 、SPSS、Minitab、Stata等。多数人较熟悉的Excel虽然不是统计软件,但提供了一些常用的统计函数以及数据分析工具 这类软件虽有不同的侧重点,但功能大同小异,基本上能满足大多数人做数据分析的需要。商业类软件使用相对简单,容易上手 主要问题是价格不菲,多数人难以接近,此外,更新速度慢,难以提供最新方法的解决方案;非商业软件——推荐使用 非商业类软件则不存在价???问题。目前较为流行的软件有R语言和Python语言,二者都是免费的开源平台 R语言的一种优秀的统计软件,它是一种统计计算语言。R语言不仅支持各个主要计算机系统,还有诸多优点,比如,更新速度快,可以包含最新方法的解决方案;提供丰富的数据分析和可视化技术,功能十分强大。此外,R软件中的包(package)和函数均由统计专家编写,函数中参数的设置也更符合统计和数据分析人员的思维方式和逻辑,并有强大的帮助功能和多种范例,初学者也很容易上手 Python则是一种面向对象的解释型高级编程语言,并拥有丰富而强大的开源第三方库,也具有强大的数据分析可视化功能。Python于R的侧重点略有不同,R的主要功能是数据分析和可视化,且功能强大,多数分析都可以由R提供的函数实现,不需要太多的编程,代码简单,容易上手。Python的侧重点则是编程,具有很好的普适性,但数据分析并不是其侧重点,虽然从理论上说都可以实现,但往往需要编写很长的代码,帮助功能也不够强大,这对数据分析的初学者来说可能显得麻烦,但仍然不失为一种有效的数据分析工具;数据(data) 数据是个广义的概念,任何可观测并有记录的信息都可以称为数据,它不仅仅包括数字,也包括文本、图像等。比如,一篇文章也可以看作数据,一幅照片也可以视为数据,等等 本书使用的数据概念则是狭义的,仅仅是指统计变量的观测结果。因此,要理解数据的概念,需要先清楚变量的概念变量的观测结果;数据是变量的观测结果,因此,数据的分类与变量的分类是相同的 本书混合使用变量和数据这两个概念 在讲述分析方法时多使用变量的概念,在例题分析中多使用数据的概念 了解变量或数据的分类十分必要,因为不同的变量或数据适用的分析方法是不同的; 抽取随机样本; 间接来源和直接来源; 抽取随机样本——例题分析; 生成随机数; 本书结构; THANKS

文档评论(0)

1亿VIP精品文档

相关文档