- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
北京大学课件统计学课件
汇报人:AA
2024-01-24
统计学基本概念与原理
描述性统计方法
概率论基础知识
推断性统计方法
非参数检验方法
统计图表展示技巧
实际案例分析与操作演示
目录
统计学基本概念与原理
01
02
统计学的作用在于通过对数据的分析和解释,帮助人们更好地理解和应对现实生活中的各种问题。
统计学是一门研究如何收集、整理、分析、解释和呈现数据的科学。
数据类型
定量数据和定性数据。定量数据是可以量化的,如身高、体重等;定性数据则是描述性的,如性别、职业等。
数据来源
主要来源于调查、实验和观察。调查是通过问卷、访谈等方式收集数据;实验是通过人为控制条件来观察结果;观察则是直接记录自然现象或行为。
研究对象的全体个体组成的集合。
总体
从总体中随机抽取的一部分个体组成的集合,用于代表总体进行统计分析。
样本
变量
在统计学中,变量是指可以取不同值的特征或属性。根据取值方式的不同,变量可分为离散变量和连续变量。
数据测量
数据测量是指根据一定的规则和标准,对研究对象的特征或属性进行度量和记录的过程。常见的数据测量尺度包括定类尺度、定序尺度、定距尺度和定比尺度。
描述性统计方法
用于展示数据分布情况,包括各组数据的频数、频率、累计频数和累计频率。
频数分布表
直方图
应用场景
用矩形面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示组距。
适用于连续型变量,可直观展示数据的分布规律,如正态分布、偏态分布等。
03
02
01
算术平均数
中位数
众数
应用场景
所有数据的和除以数据的个数,反映数据集中趋势的一项指标。
一组数据中出现次数最多的数。
将数据按大小顺序排列后正中间的数,若数据量为偶数,则中位数为中间两个数的平均数。
适用于不同数据类型,可消除极端值影响,反映数据集中趋势。
极差
方差
标准差
应用场景
01
02
03
04
一组数据中最大值与最小值的差。
各数据与平均数之差的平方的平均数。
方差的算术平方根,反映组内个体间的离散程度。
适用于不同数据类型,可衡量数据的波动情况,辅助判断数据的稳定性。
数据分布不对称,偏态系数可用于描述偏态程度,正偏态表示数据向右偏,负偏态表示数据向左偏。
偏态分布
数据分布的尖峭或扁平程度,峰态系数可用于描述峰态,正峰态表示数据分布尖峭,负峰态表示数据分布扁平。
峰态分布
适用于连续型变量,可辅助判断数据是否符合正态分布等特定分布形态,为后续统计分析提供基础。
应用场景
概率论基础知识
描述随机变量取值的平均水平,是随机变量所有可能取值的加权平均数。
期望
方差
协方差
相关系数
描述随机变量取值与其期望的偏离程度,反映随机变量的波动情况。
描述两个随机变量变化趋势的统计量,正值表示两变量同向变化,负值表示反向变化。
标准化后的协方差,反映两个随机变量线性相关的程度。
推断性统计方法
用样本统计量来估计总体参数的方法,如样本均值、样本比例等。
根据样本数据计算出一个区间,该区间以一定的置信水平包含了总体参数的真值。
区间估计
点估计
01
04
05
06
03
02
方差分析的基本原理:通过比较不同组间的方差与组内方差的大小来判断因素对指标是否有显著影响。
方差分析的步骤
提出假设。
计算各组均值和总均值,以及各组方差和总方差。
计算F值。
作出决策:根据F值的大小和给定的显著性水平,判断是否拒绝原假设。
回归分析的基本原理:通过建立一个数学模型来描述因变量与一个或多个自变量之间的关系,并利用样本数据来估计模型参数。
回归分析的步骤
确定因变量和自变量。
建立回归模型。
利用样本数据估计模型参数。
对模型进行检验和评估,包括拟合优度检验、回归系数的显著性检验等。
非参数检验方法
通过比较实际观测值与理论期望值之间的差异,判断两个或多个分类变量之间是否存在显著关联。
卡方检验的基本原理
适用于多个分类变量之间的关联性检验,如医学领域的疾病与基因型关联分析、市场调研中的消费者行为与产品属性关联分析等。
卡方检验的应用场景
优点在于简单易行,适用于大样本数据;缺点在于对数据的分布形态有一定要求,且当分类变量较多时,可能存在较大的误差。
卡方检验的优缺点
1
2
3
通过对样本数据的秩次进行求和,比较两组或多组数据分布位置是否存在显著差异。
秩和检验的基本原理
适用于两独立样本或配对样本的比较,如医学领域的两种治疗方法的效果比较、心理学领域的两组被试的智力水平比较等。
秩和检验的应用场景
优点在于对数据分布形态无严格要求,适用范围广;缺点在于对极端值敏感,且当样本量较大时,检验效率可能降低。
秩和检验的优缺点
根据样本数据的中位数或均值将数据分为正负两组,通过比较正负号的个数来判断样本数据分布是否存在显著差异。
符号检验的基本原理
适用于配对样本的比
文档评论(0)