统计学—基于R(第5版)全套PPT课件.pptx
课程内容 描述统计、推断统计、其他方法使用软件 R 语言学分与课时 3学分,1~17周,每周3课时课程简介作者贾俊平
贾俊平2023/2/131.1 数据与统计学1.2 R 语言的初步使用第 1 章 数据与 R 语言
数据与统计学1.1 统计学与数据分析 什么是统计学统计学(statistics)是分析数据的一门科学,它所提供的是一套通用于所有学科领域的获取数据、处理数据、分析数据并从数据中得出结论的原则和方法统计学是一套通用的数据分析方法,虽然这些方法可用于各学科领域数据的分析,但它不是为某个特定的问题领域构造的。因此,统计方法不是一成不变的,使用者在特定情况下需要根据所掌握的专业知识选择使用这些方法,如果需要,还要进行必要的修正 什么是数据分析数据分析(data analysis)是使用统计方法把隐藏在数据中的信息有效地提炼出来的过程,目的是找出所研究对象的内在特征和规律数据分析可帮助人们做出判断和决策,以便采取适当行动
数据与统计学1.1 数据分析方法和工具 数据分析方法从分析目的看,可以将数据分析分为描述性分析(descriptive analysis)、探索性分析(exploratory analysis)和验证性分析(confirmatory analysis)描述性分析是对数据进行初步的整理、展示和概括性度量,以找出数据的基本特征探索性分析侧重于在数据之中发现新的特征,为形成某种理论或假设而对数据进行的分析验证性分析侧重对已有理论或假设的证实或证伪从所使用的统计分析方法看,可大致可分为描述统计(descriptive statistics)和推断统计(inferential statistics)描述统计主要是利用图表形式对数据进行汇总和展示,并计算一些简单的统计量(诸如比例、比率、平均数、标准差等)进行分析,进而发现数据的基本特征推断统计主要是根据样本信息来推断总体的特征,其基本方法包括参数估计和假设检验。参数估计是利用样本信息推断所关心的总体参数,假设检验则是利用样本信息判断对总体的某个假设是否成立
数据与统计学1.1 数据分析方法和工具 数据分析工具——商业类软件商业类软件种类繁多,较有代表性的有SAS 、SPSS、Minitab、Stata等。多数人较熟悉的Excel虽然不是统计软件,但也提供了一些常用的统计函数,并提供了常用的数据分析工具,其中包含一些基本的数据分析方法,可供非专业人员做些简单的数据分析商业类软件功能大同小异,基本上能满足大多数人做数据分析的需要商业类软件使用相对简单,容易上手,但其主要问题是价格不菲,多数人难以接近商业软件更新速度较慢,难以提供最新方法的解决方案数据分析工具——非商业类软件目前较为流行的软件有R语言和Python语言,二者都是免费的开源平台R语言的一种优秀的统计软件,它是一种统计计算语言。R语言不仅支持各个主要计算机系统,还有更新速度快,可以包含最新方法的解决方案;提供丰富的数据分析和可视化技术,功能十分强大Python则是一种面向对象的解释型高级编程语言,并拥有丰富而强大的开源第三方库,也具有强大的数据分析可视化功能Python与R的侧重点略有不同,R的主要功能是数据分析和可视化,且功能强大,多数分析都可以由R提供的函数实现,不需要太多的编程,代码简单,容易上手。Python的侧重点则是编程,具有很好的普适性,但数据分析并不是其侧重点,虽然从理论上讲都可以实现,但往往需要编写很长的代码,帮助功能也不够强大,这对数据分析的初学者来说可能显得麻烦
数据(data)数据是个广义的概念,任何可观测并有记录的信息都可以称为数据,它不仅仅包括数字,也包括文本、图像等。比如,一篇文章也可以看作数据,一幅照片也可以视为数据,等等本书使用的数据概念则是狭义的,仅仅是指统计变量的观测结果。因此,要理解数据的概念,需要先清楚变量的概念变量的观测结果数据与统计学1.1 数据及其来源变量(variable)观察某家电商的销售额的销售额,这个月和上个月不同;观察股票市场上涨股票的家数,今天与昨天数量不一样;观察一个班学生的生活费支出,一个人和另一个人不一样;投掷一枚骰子观察其出现的点数,这次投掷的结果和下一次也不一样“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”等就是变量
数据和变量分类数据是变量的观测结果,因此,数据的分类与变量的分类是相同的本书混合使用变量和数据这两个概念在讲述分析方法时多使用变量的概念,在例题分析中多使用数据的概念了解变量或数据的分类十分必要,因为不同的变量或数据适用的分析方法是不同的变量分类类别变量(定性)无序类别变量(名义值)有序类别变量(顺序值)布尔变量(二值)数值变量(定量)离散变量(离散值)连续变量(连
原创力文档

文档评论(0)