第九章 数值变量资料的统计分析第一次分析.pptVIP

第九章 数值变量资料的统计分析第一次分析.ppt

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
表9-1 2002年某市150名20-29岁正常成年男子尿酸浓度 (2)定组距i:组距即组与组间的距离,一般等距分组。 i=R/K(极差/组数)=150.1/10=15.01 最终原则是取整、取偶数, 所以本例 i=15 (3)定组段的上下限并划记: 每个组段的起点(最小值)称为该组的下限(low limit),终点(最大值)称为该组的上限(upper limit)。 注意第一组段把最小值包括进去,最后一组把最大值包括进去。 4、列表:统计各组段的频数:见表9-2 表9-2 2002年某市150名正常成年男子尿酸浓度 图9-1 2002年某市20岁-29岁正常男子的尿酸浓度频数分布 1.算术均数(mean) 例9-2 8名正常成年女子的血清甘油三酯(mmol/L)的测定值分别为1.34,0.96,1.11,1.52,1.12,0.91,1.33,1.24,求其算术均值。 表9-2 2002年某市150名正常成年男子尿酸浓度均数加权法计算表 表9-3 2002年某市150名正常成年男子尿酸浓度标准差加权法计算表 2. 几何均数(geometric mean) 几何均数的适用条件与实例 频数表资料的几何均数-加权法 3. 中位数(median)与百分位数 中位数计算公式与实例 频数表资料的中位数 百分位数 Percentile Px计算 当nX%带有小数位数时, 频数表资料的百分位数 表9-2 2002年某市150名正常成年男子尿酸浓度 小结: 1.极差(Range) (全距) 2.百分位数与四分位数间距 Percentile and quartile range 百分位数的应用 3.方差 样本方差为什么要除以(n-1) 4.标准差 标准差的计算 例9-8 6名男婴的出生体重为2.85,2.90,2.96,3.00,3.05,3.18,求标准差 5. 变异系数 变异指标小结 正态分布的重要性 医学研究中的某些观察指标服从或近似服从正态分布; 很多统计方法是建立在正态分布的基础之上的; 很多其他分布的极限为正态分布。因此,正态分布是统计分析方法的重要基础。 正态分布的数学形式 记作: X ~ N(μ,σ2) 例如: X ~ N(120,8.22) X ~ N(5,32) 正态曲线下面积的分布规律 正态曲线下面积的意义:正态曲线下一定区间内的面积代表变量值落在该区间的概率。整个曲线下的面积为1,代表总概率为1。 曲线下面积的求法:定积分法和标准正态分布法 标准正态分布与正态分布的转换 标准正态分布:指均数为0,标准差为1的正态分布。常称z分布或u分布。 标准正态分布与正态分布的转换公式: 标准正态分布曲线下的面积的计算 求z值,用z值查表,得到所求区间面积占总面积的比例。 曲线下对称于0的区间,面积相等。 曲线下总面积为100%或1。 例 已求得某市120名岁男童身高均数为142.67cm,标准差为6.00cm。设该资料服从正态分布,试求: 该地12岁男童身高在132cm以下者占该地12岁男童总数的比例。 例 已求得某市120名岁男童身高均数为142.67cm,标准差为6.00cm。设该资料服从正态分布,试求: 分别求均数±1s、均数±1.96s和均数±2.58s范围内12岁男童占该组儿童总数的实际百分数,并与理论百分数比较。 142.67±1s= 142.67 ±6=(136.67,148.67) 参考值为什么波动? “个体变异”:同一指标的数据因人而异 同一个体的数据随环境、时间等改变而变 为什么要确定一个范围? 既然同属正常人,就不能以甲的数据为标准,认为乙异常,亦不能以甲此时的数据为标准,认为彼时的异常。所以必须确定一个波动范围。如WBC:4000-10000个/mm3 “正常”是一个相对的概念 “正常人”是指排除了影响所研究指标的疾病和有关因素的人。 选定同质的正常人作为研究对象 同质 正常 “足够数量” 例数过少,代表性差;例数过多增加成本,且易导致正常标准把握不严,影响数据的可靠性。 一般认为每组100例以上 ;有人认为确定临床生化指标的正常值应取300-500例。 控制检测误差 通过人员培训、控制检测条件、重复测定等措施,严格控制检测误差。 判断是否分组 组间差别是否有统计学意义并有临床意义? 例:红细胞、白细胞 各组的分布范围、高峰位置等是否基本一致? 单、双侧问题 过大或过小均属异常 :双侧界值 例:白细胞计数 仅过大或过小为异常:单侧界值 例:肺活量仅过低异常 下限 尿铅仅过高为异常 上限 选择百分界值 参考值范围的涵义:绝大

文档评论(0)

xuefei111 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档