- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
柏建岭讲稿 柏建岭 南京医科大学公共卫生学院 流行病与卫生统计学系 主要内容 个体变异 频数分布表(图) 定量指标的描述 集中位置 离散趋势 总结 一个原始资料 频数表编制步骤 求极差 选定适当的组段数后估计组距 列出组段 划记归组获得频数 求频率,完成频数表 频数分布表的编制 求极差或全距(Range): R=Xmax-Xmin R = 160.9-125.9=35(cm) 选定适当的组段数后估计组距( i ) 组段数的选取以能反映资料的分布特征为宜 一般取8 ~ 12组 i =35/10=3.5≈4(cm) 频数分布表的编制 划记归组获得频数 常用的划记方法: “正” ;“||||” 求频率,完成频数表 相应的频数除以总数即为频率 各组段的频率总和为1或者100% 计量资料的频数、频率分布 频数分布特征 数据分布的范围: 125.9~160.9cm 集中位置:中等大小人数居多,向中间集中 数据最集中的区间:140.0~144.0 cm 离散趋势:以中等大小的区间为中心,向两侧逐渐分散 分布形态:基本对称 定量资料的统计指标 集中位置的描述 离散趋势的描述 集中位置的描述----平均数(average) 均数(arithmetic mean, mean) 平均数(average) 加权均数(weighted mean) 均数是加权均数的一个特例 平均数(average) 几何均数(geometric mean) 几何均数例 1:10, 1:20, 1:40, 1:80, 1:160 中位数例 9例正常人的发汞值(?mol/kg ): 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 M=4.8 10例正常人的发汞值: 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16.3 M=(4.8+5.6)/2=5.2 平均数(average) 百分位数(percentile) 平均数应用的注意事项 同质的资料计算平均数才有意义 根据资料分布的特征选用适当的平均数 均数:单峰对称分布的资料 几何均数:等比资料、滴度资料、对数正态分布资料 中位数:理论上可用于任何分布资料,但当资料适合计算均数或几何均数时,不宜用中位数。 (偏态分布、分布不明资料、有不确定值的资料) 看一个例子: 有甲、乙两组同性别同年龄儿童体重(kg): 甲组 26,28,30,32,34 =30 kg n甲=5 乙组 24, 27, 30, 33, 36 =30 kg n乙=5 上述两组数据的特点: 集中位置 相同:均为30kg 离散程度不同:各观察值离均数的远近不同 离散趋势的描述 全距(Range) 亦称极差,记为R,是一组变量值中最大值与最小值之差。 优点:简单明了 缺点:不灵敏、不稳定 离散趋势的描述 四分位数间距(interquartile range) 定义为: QU~QL,即中间一半观察值的极差。 四分位数(quartile)是两个特定的百分位数:第25%分位数P25,和第75%分位数P75,分别记为QL和QU。 四分位数间距较全距稳定,常与中位数一起,描述不对称分布资料的特征。 离散趋势的描述 方差(Variance)和标准差(Standard Deviation) 总体均数?未知,用样本均数估计 标准差大: 分布分散、不整齐、波动大; 标准差小: 分布集中、整齐、波动较小。 离散趋势的描述 变异系数(coefficient of variation) 亦称离散系数(coefficient of dispersion),是标准差s与均数之比,即: 变异系数的两个特点及相应的用途 没有单位 反映标准差占均数的百分比或标准差是均数的几倍 可用来比较度量衡单位不同的资料的变异度 不受平均水平的影响 反映的是以均数为基数的相对变异的大小 比较均数相差悬殊的资料的变异度 平均数与变异度的关系 平均数表示的集中性与变异度表示的离散性,是从两个不同的角度阐明计量资料的特征 变异度越小,平均数对各变量值的代表性越好 变异度越大,平均数对各变量值的代表性越差 资料的指标描述 是统计描述的一个重要的组成部分 定量资料的统计指标 平均水平指标:算术均数、
文档评论(0)