第八章数值变量数据统计推断.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章数值变量数据统计推断

第九章 数值变量数据的统计推断 课 时:8学时,其中理论4学时,实验实习4学时。 目的要求: 1. 掌握均数抽样误差的概念及其总体均数可信区间的估计;检验和检验的计算和应用条件。 2. 熟悉标准差与标准误的区别;方差分析的基本思想、计算和应用条件;假设性检验的基本步骤 3. 了解假设检验的注意事项,假设检验中的两类错误的含义。 重 点:抽样误差的概念、总体均数可信区间的估计、检验和检验的计算和应用条件。 难 点:标准差与标准误在应用上的区别、方差分析、假设检验中的两类错误。 教学方式:讲授 学时安排:组织教学1×2分钟,复习旧课3×2分钟,讲授新课85×2分钟,小结4分钟。实习4学时。 理论教学基本内容如下: 第一节 均数的抽样误差和总体均数的估计 一、均数的抽样误差与标准误 前面已给大家介绍了总体与样本的关系,在医疗、卫生实践和医学科学研究工作中,往往不可能,也没必要对所研究总体包含的每个个体逐一地加以观察与研究。通常是从总体中随机抽取一部分个体作为样本,以样本的研究结果对总体进行估计,这种研究方法称为统计推断。例如为了解某地20岁健康男大学生身高的总体均数,就可采取抽样的方法在该地随机抽取110名健康男大学生,得出身高的=172.73cm,用它估计20岁男大学生的身高的,由于个体差异的存在,样本均数往往不等于总体均数(≠),若同时抽取=110若干个样本,所得的各个样本均数往往也不相等(≠)。这种由抽样误差而造成的样本均数与总体均数的差别或各样本均数间的差别称为抽样误差(sampling error of mean)。 抽样误差在抽样研究中是不可避免的,变异是客观存在的,抽样时由于每个样本所饱含不同的个体,致使抽样研究产生抽样误差,其大小可用均数的标准差描述。样本均数的标准差,简称标准误(Standard error ,SE),便于与个体变异的标准差区别。它同标准差一样,也是一种变异指标,同质资料中,标准误差大,说明抽样误差大,用样本均数代表总体均数的可靠性小,而标准误差小,则说明抽样误差小,用样本均数代表总体均数的可靠性大。标准误的计算公式为: (9.1) 在实际工作中,总体标准差往往未知,通常用样本标准差S作为的估计值,因此有: (9.2) 由公式(9.2)知,当固定时,标准误差与标准差成正比,标准差固定时,标准误与样本含量的平方根成反比,故控制标准差和扩大样本含量是控制抽样误差的主要方法。 标准误的应用: 1.用以衡量抽样误差的大小,从而说明样本均数的可靠性,同性质资料小,说明抽样误越小,样代表的可靠性越大,反之,可靠性越小。在医学文献上常用样本的形式来表示资料的均数其可靠程度。如某地110名20岁男大学生身高资料,、、,此资料就可写成 2.结合正态分布,t分布曲线下的面积规律,估计总体均数的可信区间。 3.应用标准误来进行均数的显著性检验——假设检验,见下一节。 三、t分布(t--distribtion) 若从正态分布总体中以固定抽取若干样本时,所得的样本均数的分布服从正诚分布。即。同样,也可对正态变量进行变换,变换为标准正态分布(0,1),即分布。中间部分的95%的值在-1.96~1.96(-0.05/2~0.05/2)之间,与之相对应的曲线下双侧尾部的概率(面积)值为5%(0.05);99%d 值在-2.58~2.58(-0.01/2~0.01/2)之间,值为1%(0.01)。 由于实际工作中,σ往往是未知的,常用作为的估计值,为与变换区别,称为变换,统计量值的分布称为分布。分布由一簇曲线所组成,曲线的形状与自由度有关,=(限制途径的个数)。如有10个苹果,在3个人中以自取的方式肺泡,第一、第二个人可自由取,但第三个人只能取剩余的苹果。苹果的总数是限制条件,故自由度为3-1。一组资料当合计固定不变时,其自由度为。由图9-1可见,t分布是一簇对称于0的单峰分布曲线。 分布的特征: ①以0为中心的对称分布。 ②分布曲线不是一条曲线,而是一簇曲线,其形态与自由度大小有关,自由度越大,分布越接近分布,自由度越小,分布越低平,自由度逐渐增大时,分布逐渐逼近分布,当自由度趋于∞时,分布即为分布。 由于分布是一簇曲线,故分布曲线下面积的95%或99%界值不是一个常量,而是随着自由度大小而变化的。为便于使用,统计学家编制了不同的自由度对应的界值表(附表9—1)。分布主要用于总体均数的区间估计及检验等,附表9—1只列出了正值,若算得的值为负值时,可用其绝对值查表。(因分布是以0为中心的对称分布) 四、总体均数可信区间的估计 用样本指标值(统计量)估计总体指标值(参数),称为参数估计(confi

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档