医学统计学核心要点.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

医学统计学核心要点

演讲人:

日期:

06

统计软件实践

目录

01

基础概念解析

02

数据描述方法

03

概率分布理论

04

假设检验框架

05

相关与回归分析

01

基础概念解析

统计学基本术语定义

总体

研究对象的全体,是统计学研究的基础。

01

样本

从总体中抽取的一部分,用于推断总体特性。

02

变量

研究对象的特征或属性,可分为自变量和因变量。

03

统计量

用来描述样本或总体特性的数值指标。

04

数值变量

可以取值为数字,并具有大小、多少等含义的变量,如年龄、身高等。

分类变量

将研究对象按某种属性或特征分类的变量,如性别、血型等。

有序分类变量

分类变量的一种,但类别之间有顺序关系,如疼痛程度等。

无序分类变量

分类变量的一种,类别之间无顺序关系,如血型等。

数据类型与变量分类

不对研究对象进行干预,仅通过观察记录数据进行分析,如横断面研究、队列研究等。

对研究对象进行人为干预,观察干预效果,如随机对照试验等。

类似于实验性研究,但无法完全控制干扰因素,如前后对照研究等。

通过抽样方式获取样本,对样本进行研究以推断总体特性,如抽样调查等。

研究设计类型区分

观察性研究

实验性研究

准实验性研究

样本调查

02

数据描述方法

用于描述一组数据的“平均水平”,反映数据集中趋势的度量,但易受极端值影响。

平均数

集中趋势指标计算

中位数

将一组数据按大小排序后位于中间位置的数,能更好地反映数据的中心趋势,但不适用于偏斜分布的数据。

众数

一组数据中出现次数最多的数,适用于描述分类数据的集中趋势。

离散程度度量方式

极差

一组数据中最大值与最小值之差,简单易算,但易受极端值影响。

01

每个数据与平均数的差的平方的平均值,能更好地反映数据的离散程度,但计算较复杂。

02

标准差

方差的平方根,与原始数据单位相同,便于理解和比较。

03

方差

数据分布图形呈现

条形图

用直条的长短来表示各数据的大小和它们之间的对比关系,适用于分类数据的展示。

01

折线图

用折线连接各数据点,反映数据的变化趋势和波动情况,适用于时间序列数据的展示。

02

饼图

用扇形面积表示各部分所占的比例,适用于展示数据的构成和分布情况。

03

03

概率分布理论

以固定次数进行独立重复的试验,每次试验仅有两个可能结果,且单次试验中成功的概率不变。

连续随机变量的概率分布,呈钟形对称,均值处达到峰值,左右两侧逐渐下降并趋于无穷。

描述单位时间或空间内某事件发生的次数,适用于稀有事件且发生概率稳定的情况。

描述事件发生的时间间隔,常用于生存分析和可靠性研究。

常见概率分布特征

二项分布

正态分布

泊松分布

指数分布

中心极限定理应用

样本均值的分布

01

当样本量足够大时,样本均值的分布将趋近于正态分布,无论总体分布形态如何。

样本均值的方差

02

当样本量增加时,样本均值的方差将逐渐减小,趋于总体方差除以样本量。

样本比例的分布

03

当样本量足够大时,样本比例的分布也将趋近于正态分布,其方差为总体方差除以样本量乘以(1-总体比例)。

中心极限定理在假设检验中的应用

04

通过样本统计量推断总体参数时,可以利用中心极限定理计算近似概率,从而进行假设检验。

参数估计方法选择

点估计

最大似然估计

区间估计

贝叶斯估计

根据样本数据直接计算总体参数的估计值,包括算术均数、几何均数、中位数等。

通过样本数据构造一个包含总体参数的区间,并给出该区间包含总体参数的概率,常用的方法有正态近似法和置信区间法。

基于样本数据构造似然函数,通过最大化似然函数得到总体参数的估计值,适用于大样本和复杂分布的情况。

将总体参数视为随机变量,通过样本数据和先验分布计算后验分布,从而得到总体参数的估计值,适用于具有先验信息的情况。

04

假设检验框架

参数检验与非参数检验

01

参数检验

适用于总体分布形式已知且对总体参数所做假设,如t检验、方差分析等。

02

非参数检验

不依赖于总体分布的具体形式,应用时不要求总体分布类型,如秩和检验、卡方检验等。

检验步骤与结果解读

确定研究假设,包括零假设和备择假设。

设定假设

选择检验方法

计算检验统计量

根据样本特征和研究目的,选择合适的检验方法。

根据样本数据计算检验统计量,如t值、F值等。

确定P值

结果解读

根据检验统计量和相应分布,计算P值,反映观察结果与零假设的差异程度。

根据P值大小,结合显著性水平,做出接受或拒绝零假设的决策。

Ⅰ/Ⅱ类错误控制策略

Ⅰ类错误(假阳性)

拒绝实际上成立的零假设,通过控制显著性水平α来降低Ⅰ类错误发生概率。

Ⅱ类错误(假阴性)

权衡两类错误

未能拒绝实际上不成立的零假设,通过增大样本量、提高检验效能等方法来降低Ⅱ类错误发生概率。

在科研实践中,需根据研究目的和实际情况,权衡Ⅰ类错误和Ⅱ

文档评论(0)

东写西读 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档