- 1、本文档共48页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
均数的抽样误差,t分布,参数估计Sampling error of mean,t-distribution,parameters’ estimation 张建军 汕大医学院预防医学教研室 Tel: 0754Email: zhangjj@stu.edu.cn 主要内容 均数的抽样误差 t分布 参数估计 概念: 频数分布以均数为中心,左右两侧基本对称,靠近均数两侧频数较多,离均数愈远,频数愈少,形成一个中间多,两侧逐渐减少的对称分布。 是一种连续型分布。又称高斯分布. 正态分布用N(μ, )表示,其位置与均数有关,形状与标准差有关。 医学现象许多呈正态分布,或近似正态分布:如正常人的生理,生化指标变量,等 正态分布的密度函数:式中μ为均数;σ为标准差;π为圆周率;е为自然对数的底,即2.71828。以上均为常数,仅x为变量。 标准正态分布: 为了应用方便,常将式进行变量变换,即:u变换. 所得到的新变量u的分布即为标准正态分布。 u的含义:变量到均数间的距离相当于标准差的倍数。 正态分布的特征和分布规律: (1)曲线在x轴的上方,与x轴不相交,当x=μ时,曲线位于最高点。 f(u=0)=0.3989 (2)曲线关于直线x=μ左右对称。 (3)正态分布有两个参数:均数,标准差;标准正态的参数分别为:0, 1 (4)正态分布的面积分布有一定规律。 请思考: 抽样? 统计量? 抽样分布? 一、均数的抽样误差和标准误 均数的抽样误差sampling error of mean 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率),样本均数之间也互不相等,这种由抽样引起的差异称为均数的抽样误差的体现。 即: 如何估计抽样误差? 标准误 standard error,SE 以样本均数为例: SE 越大,均数的抽样误差越大,样本均数与总体均数间的差异越大。 当样本例数一定时,样本均数的标准误与原始数据的标准差成正比;当标准差一定时,标准误与样本含量 n 的平方根成反比。增加样本含量可以减小抽样误差。 与标准差的区别: 标准差:表示一般个体值的离散程度; 标准误:特别说明统计量的离散程度。 再思考一个问题: 其它的统计量有抽样误差吗? 它们的计算公式怎样? 标准误的应用 1、用来衡量抽样误差的大小: 标准误越小,样本均数与总体均数越接近,样本均数的可信度越高; 2、结合标准正态分布与 t 分布曲线下的面积规律,估计总体均数的置信区间。 3、用于假设检验。 抽样分布 假定2003年汕头市15岁女学生的身高服从均数155.4cm、标准差5.3cm的正态分布。用计算机做抽样模拟试验,从N(155.4, 5.32)的总体中,每次抽出10个数字(样本含量为10),组成一个样本,求出样本均数 、样本标准差 S。 再求得此100个样本均数的均数、样本均数的标准差。 样本均数的标准差是什么?…….. 100个样本均数构成一个新的分布,也是正态分布。 即使原分布为偏态分布,当样本含量足够大时,新分布也近似正态分布)。新分布的集中趋势用均数的均数来表示,离散趋势用标准误表示N( , ) 。 各样本均数的均数等于总体均数。 二、t 分布(t-distribution) 还记得吗? u转换将正态分布转换为标准正态, N(0, 1)。 同理:将样本均数的分布也可以转换为标准正态分布 。 即: 实际工作中,总体标准差往往未知,常用S代替σ 计算标准误,因此:为了和u分布区别,就变为: 均数的分布也是这样 如果我们采用另一个正态变量: 于是,均数的分布变成了标准正态分布: 但是,条件发生了变化 我们通常用 代替 然而, 随着样本量的变化而变化,所以,我们称之为 t-分布,虽然它是正态分布,但只有当样本量(自由度)无穷大的时候,它才是标准正态分布,此时,u=t t分布曲线 t分布是一簇对称于0的单峰分布曲线。 自由度越小(相当于标准差大),曲线的中间越低,两边越高;随自由度增大, t分布曲线逐渐逼近于标准正态分布曲线。 当自由度无穷大时, t分布就是标准正态分布曲线。 每一条t分布曲线,都对应于相应的自由度。 t分布模拟试验 t分布曲线下的面积规律 与标准正态曲线下的面积规律相似: 在某一个自由度下,两侧外部总面积为5%的界限的t值称为t0.05/2(υ),把两侧外部总面积为1%的界限的t值称为t0.01/2(υ)。 因此,中部占95%
文档评论(0)