数据特征与统计描述.PPT

数据特征与统计描述.PPT

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
盘编号  甲 乙 丙 1 440 480 490 2 460 490 495 3 500 500 500 4 540 510 505 5 560 520 510 合计 2500 2500 2500 均数 500 500 500 例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3) 甲 乙 丙 例4-9,etc 第四章 数据特征与统计描述 第一节 频数分布表与频数分布图 第二节 计量资料的常用统计指标 第三节 计数资料的常用统计指标 第四节 统计图表 本章结构 第一节 频数分布表与频数分布图 一、频数分布表 (frequency table) 用途:用于描述资料的分布特征 频数:在一批样本中,相同情形出现的次数称为该情形的频数。 资料类型 组段 频数 计数和等级 观察结果的所有分类 相同类别出现的次数 计量 根据观察结果重新划分 分组统计 P44 表4-1,4-2,4-3 (P44) 1. 频数表的编制步骤 (1)求极差(range):即最大值与最小值之差,又称为全距。 本例极差: R=5.88-3.79=2.09(1012/L) (2) 决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分8-15个组,为方便计,组距参考极差的十分之一, 再略加调整。 本例i= R /10=2.09/10=0.209≈0.2 (1012/L) (3) 确定组段的上、下限,列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。 组段下限(L):每个组段的起点 组段上限(U):每个组段的终点 (4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。 P46 表4-4 三、频数分布图 P47 二、计量资料频数表和频数分布图用途 1.描述频数分布的类型* (1)对称分布 :若各组段频数的分布以频数最多的组段为中心左右两侧大体对称(总体则完全对称),就认为该资料是对称分布 (2)偏态分布 : 右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。 表2-2 115名正常成年女子血清转氨酶(mmol/L)含量分布 左偏态分布(负偏态分布): 左侧的组段数多于右侧的组段数,频数向左侧拖尾。 表2-3 101名正常人的血清肌红蛋白( )含量分布 2. 描述计量资料的分布特征 ①集中趋势(central tendency):变量值集中位置。本例在组段“4.7~4.9”。 ——平均水平指标 ②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。本例;离“中心”位置越远,频数越小;且围绕“中心”左右对称。 ——变异水平指标 3.便于发现一些特大或特小的可疑值* 4.便于进一步做统计分析和处理 第二节 计量资料的常用统计指标 计量资料(定量资料、数值变量资料) 总体:有限或无限个(定量)变量值 样本:从总体随机抽取的n个变量值: X1, X2, X3, ……, Xn n为样本例数(样本大小、样本含量) 一、描述集中趋势的特征数 总称为平均数(average)描述一组数据的中心位置,反映一组同质资料的集中趋势( central tendency )。 P48 常用的有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median) 4. 众数(mode) 作用: 1.代表性 2.组间比较 选用:根据分布 均数(mean) Σ为求和符号,读成sigma,k, X , f 意义 例4-2 “权数” 例4-3 符号:总体 样本 适用条件:资料呈对称分布,尤其是正态或近似正态。 计算: (1)直接法 (2)频数表法 例4-2 2. 几何均数(geometric mean) 几何均数:变量对数值的算术均数的反对数。 意义:用于描述对数正态分布、或数据呈倍数变化资料的平均水平。 符号: 计算: (0,负数?) (4-3) 几何均数的适用条件与实例 适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料 例 血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求几何均数。 此例的算术均数为22222,显然不能代表滴度的平均水平。同一资料,几何均数均数 P50 例4-4 频数表资料的几何均数 (4-5) 例4-5 3. 中位数(medi

文档评论(0)

cyx + 关注
实名认证
内容提供者

装饰装修木工持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月15日上传了装饰装修木工

1亿VIP精品文档

相关文档