- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SB◆统计学要点#jpg(页)
统计学要点(中大公卫.骆福添)
?内容结构
1.统计基础:基本的 概念.术语.方法,须完全掌握 (~t检验)
任务:描述样本特征.估计总体参数.检验总体差别
规则:必须考虑 数据类型.分布类型.对比类型
2.基本方法:对应资料类型;掌握“适用.步骤.结果”(t.F, u.?2, H, r.b)
3.专门方法:对应研究类型;熟悉“适用.设计.数据.结果”(…)
?学习方法:按知识点 归纳.理解.应用.表达(读书不背书、背熟了即糊涂了)
★ 统计基础:
数据/变量分布的概况分布的指标分布的应用样本数据 x 频数分布表
频数分布图描述指标(,Sx)参考范围 随机变量 X
,误差概率分布表
概率分布图总体参数()
()置信区间 ?:
假设检验 P(Z?k|?=?0)=??分布面积划分(双侧):中间A=认同域概率,尾部P=否定域概率 (正态分布两重性)
? P值是样本信息支持(否定)H0的概率
? P(Z?k|?=?0) = 在H0: ?=?0条件下,Z不小于当前统计量值k的概率
例如,单侧:P(Z?1.96|?=?0)=0.025,双侧:P(|Z|?1.96|?=?0)=0.05
-1.96S +1.96S
把握度(1-?)=0.95=中间面积
图a 参考范围
图b 置信区间(反推)
-1.96 0 1.96
条件概率P=0.05 ? =尾部面积
图c 假设检验
变量值分布: x呈正态 误差分布: (-?)呈正态 统计量分布: Z呈标准正态
(为中心) (? 为中心) (0 为中心)
RI把握度=A (正向推理) CI置信度≈A (逆推理) 支持H0的概率=P (正向推理)
此范围个体属于正常的概率P=0.95 此区间包含?的置信度=0.95 某个属于H0的概率P0.95
【例】:有一年本科医学统计考试,题目(15分)给出12个女学生的身高数据,请作“统计分析”(提示:写出分析方法步骤和指标意义,不用计算)。
结果有2/3的考卷此题空白,怎么回事?
? 统计方法与资料分析:
△ 临床医学:例如,学习“急腹症”和看“急腹症”是两码事,
前者是各个纵向的顺序的“学病”(来一个?)(外科学),后者是横向的逆序的“看病”(手册)
△ 医学统计:“医学统计学”是“学病”,资料分析是“看病”(手册?)
本例:小样本单组身高(数据-分布-对比)
(1)考虑:计量.正态.单组 ? 均数与标准差(小样本不必图表)
(2)考虑:计量.正态.单组 ? 95%可信区间为 均数±t?×标准误
(3)考虑:计量.正态.单组 ? 样本与总体比较的t检验
-1.96 ? 1.96
图A 抽样试验的样本均数分布图
P=0.025
P=0.025
0
X
-3 -2 -1 0 1 2 3 Z
图B 标准正态分布图
图9.1 一年级女大学生体重与肺活量散点图
2.0
2.2
2.4
2.6
2.8
3.0
3.2
3.4
3.6
3.8
40
42
44
46
48
50
52
54
56
58
体重(kg) X
肺
活
量
(L)
Y
▲双变量:简单相关与回归
?最小二乘法(则) 使最小,即使残差平方和最小
?散点图分布特征
集中趋势:回归直线,即
离散趋势:残差平方和,即 对立面即 密切程度:
? 多重相关与回归
集中趋势:多维空间散点分布,;离散趋势:多重相关系数
★偏回归与偏相关(Xk):散点在“Xk平面”上的投影(散点的影子存在“简单相关与回归”)
? 三大回归
多重回归(Y=正态)、Logistic回归(Y=0,1)、Cox回归(Y=0,1,Y = time±)
▲等级变量
表a n=3时的秩和T及其分布 0411骆福添
秩次t(名次)
组合情况定义
秩和
T=∑t+理论
频数
f图A 秩和T的理论频数分布及其正态拟合曲线 0411骆福添
0
3
6
9
12
15
a1. 秩和(n=3,Σf=8)
0
1
2
3
频数
0.125
0.250
0.375
概
率
a2. 秩和(n=5,Σf=32)
概
率
0.062
0.031
0.093
0
1
2
3
频数
0
3
6
9
12
15
7.5
概率
分布P
=f/∑f0个正秩-1-2-3010.1251个正秩+1
文档评论(0)