- 1、本文档共91页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
现实中的研究过程 统计推断 采用抽样研究的方法,由某总体中随机抽取一个有代表性的样本,并根据样本提供的信息(统计量)推断总体特征、性质(参数)的过程称为统计推断 statistical inference 统计推断 统计推断包括两个重要的方面: 一是利用样本统计量的信息对相应总体参数值做出推断,如用样本均数估计总体均数,用样本标准差估计总体标准差等,称之为参数估计 另一个是利用样本统计量来推断我们是否接受一个事先关于总体的假设,称之为假设检验 使用样本统计量过程中的问题 不同的研究者对相同的总体作类似的抽样研究可能会得到不同的样本统计量 各自用样本统计量估计总体的参数,样本统计量与总体参数间是否完全相等?如何评价他们的准确性? 一、均数抽样误差和标准误 已知某地高中三年级男生的身高满足正态分布,其平均身高为168.15厘米,这里,将该地高中三年级男生的身高视为一个总体。现从该总体中随机抽样5次,每次抽取一个样本含量n=10的样本,得到的5个样本的数据及各样本均数如下: 样本均数的特点 各个样本均数之间都不相同——抽样误差表现形式之一 各个样本均数都不等于总体均数,有的比总体均数大,有的比它小——抽样误差表现形式之二 相对于各样本的个体值,样本均数间的变异程度较小 样本均数的抽样分布 仍以某地高三男生的身高为例,设身高变量为x,假定x服从正态分布,记为x~N(168.15, 62) 从总体X中反复随机抽样,样本含量分别为n=4,n=16和n=36,分别随机抽10000个样本并计算样本均数,把同一样本含量的10000个样本均数视为一个新的样本资料作频数图 样本均数的分布规律 大多数的样本均数相互之间存在差异,绝大多数的样本均数不等于x的总体均数 样本均数的集中趋势位置与个体资料x的集中趋势位置较为接近,样本均数的频数图均呈现出中间多、两边少且基本对称的正态分布特征。 样本均数的分布范围较个体值小;随着样本含量的增大,样本均数的频数分布范围越来越窄 每种样本量的10000个样本均数值所计算出的样本均数的标准差都非常接近 (?为个体资料x的总体标准差,n为个体数) 样本均数的分布规律 理论上可以证明:从正态分布的总体 中随机抽取样本含量为n的一批样本,样本均数 有如下性质 : 样本均数 服从正态分布 样本均数 的总体均数为 样本均数的标准误 为了与个体的标准差相互区别,样本均数的标准差又称为样本均数的标准误standard error, SE,或理论标准误 反映了样本均数间的离散程度,如果SE很大则不同的样本均数间参差不齐,同时样本均数的分布范围较大,也反映了样本均数与总体均数间的差异可能较大,因而标准误反映均数抽样误差的大小;它与总体标准差成正比,与总体中的个体数的平方根成反比 代表样本均数的标准误,其表达式为 均数的标准误的影响因素 从标准误的计算公式中看出它与原先个体观察值的总体标准差s有关,同时也和样本含量n有关 在固定样本含量的情况下,总体标准差越大,则样本均数间越参差不齐,抽样误差越大;但是总体标准差是参数,在抽样之前就已经存在,无法改变它的大小 故可行的方法是通过扩大样本含量减少标准误;从而减少抽样误差 均数标准误的估计值 由于在实际研究中,我们往往只抽一次样,得到一个样本均数,而且大多数情况下s未知,此时常用样本标准差S估计总体标准差s,这样我们就得到样本均数标准误的估计值 抽样误差越小,表示样本均数与总体均数越接近,用样本均数估计总体均数的可靠性越高;反之则越低 例6.1随机抽取某地正常成年男性200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L,试估计抽样误差: 例子6.2 两文献表述有何区别 二、t分布 对于某个资料,其个体变量 服从正态分布,记作: u值~标准正态分布 对服从正态分布的个体变量值 作下列转换: 变量值u也服从正态分布,记作 样本均数~正态分布 样本均数u转换~标准正态分布 既往资料表明某市区新生女婴的平均出生体重为3.10kg,标准差为0.59kg 。某研究者从该市区中随机抽取一个由100个女婴组成的样本,请问出现样本均数超过2.87kg算不算是小概率事件? 样本均数标准正态性转换中的实际问题 要对样本均数进行u转换,必须要知道总体的标准差s;但是在实际的情况下,并没有对总体中所有的个体进行观察,所以无法得知 s;而且通常我们也只作一次抽样研究,只能得到s ,只能用样本标准误的估计值 估计 那么
文档评论(0)