卫生统计学第八版李晓松第一章-数据分布的描述.pptVIP

卫生统计学第八版李晓松第一章-数据分布的描述.ppt

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
卫生统计学第八版李晓松第一章-数据分布的描述

* * * * * * * * * * * * * * * * * * * * * * 第四节 箱式图 (一)箱式图 第四节 箱式图 15例大骨节病患者白细胞数箱式图 1. 表示中位数的横线在箱体中间位置则表明数据呈对称分布。 2. 中间横线靠下端则提示右偏态分布。 3. 中间横线靠上端则提示左偏态分布。 (一)箱式图 第四节 箱式图 广州市一项关于慢性鼻窦炎患病率的横断面调查中,用SF-36量表测得所有调查对象的生活质量,所调查的1411名成年居民中有118名患有慢性鼻窦炎。以慢性鼻窦炎患者和正常人的精力评分为例,绘制箱式图。 正常人与慢性鼻窦炎患者精力评分箱式图 “?”表示均数 “〇”表示离群值 (二)箱式百分位数图 第四节 箱式图 1. 箱式百分位数图(box-percentile plot)结合了箱式图和直方图的功能,不仅给出了几个关键的百分位数,还描述了整个数据的分布形态。箱体中间部分最宽,越往两端越窄。 2. 制作方法 首先将n个观测值从小到大排列,假设箱体最中间(中位数位置) 宽度为w,则将数据从小到大排列后第k个观测值xk所在位置的箱体宽度为: (二)箱式百分位数图 第四节 箱式图 以下为慢性鼻窦炎患者健康评估总分同时绘制了箱式图与箱式百分位数图,箱式百分位数图呈梭型左右对称。若关于中位数上下对称则提示资料呈对称分布。 慢性鼻窦炎患者健康评估总分的箱式图(A)和箱式百分位数图(B) (二)箱式百分位数图 第四节 箱式图 慢性鼻窦炎患者精力评分的箱式图(A)和箱式百分位数图(B) 慢性鼻窦炎患者精力评分呈左偏态分布。 箱式图显示该组数据有两个数值特别小的离群点。 箱式百分位数图从箱体往下延伸出一条又长又细的线——离群点。 第五节 数据核查与离群值 (一)逻辑核查 第五节 数据核查与离群值 1. 逻辑核查的几种常用策略 (1)检查变量类型和性质:变量可分为数值型变量与字符型变量。数值型变量只能包括数字、小数点和负号,个别情况也包括作为千位分隔符的逗号,不能含有字母或文字。 (2)核查变量值范围:检查每个变量的取值范围。例如:一个人的体重不能为负数;出生月份应 在1~12之间;某成年男性的身高值低于140cm或者高于210cm也值得怀疑。 (3)有效值检查: 检查观测值是否为事先定义的数值之一。例如:录入性别时,事先规定用1表示男性,2表示女性,如果数据中出现其他观测值则说明有误。 (一)逻辑核查 第五节 数据核查与离群值 1. 逻辑核查的几种常用策略 (4)一致性检查:检查有无前后矛盾,相关问题的逻辑是否一致。出院日期早于入院日期、收缩压小于舒张压等都不符合逻辑。 (5)唯一性检查:每个观察单位通常都设有一个唯一的标识号,如调查对象编号、住院号、门诊号等。根据标识号检查是否存在同一个观察单位的数据两次重复录入。 (6)完整性检查:检查每一个观察单位的完整性和整个数据库的完整性。 (7)交叉检查:不同来源的两个数据库中同一内容的信息应该一致。 (二)离群值的初步探索 第五节 数据核查与离群值 (二)离群值的初步探索 第五节 数据核查与离群值 2. 核查离群值的统计手段 (4)通过统计检验判断:检验偏离程度是否超出随机误差所能解释的上限。已知标准差时可用Nair检验法,未知标准差时可用Grubbs检验法、Dixon检验法和峰度-偏度检验法。 (5)结合其他变量信息判断:根据儿童的身高,可初步判断其体重是否过高或者过低。根据身高所建立的体重核查规则比单纯只考虑体重的核查更为有效。 (三)离群值的处理 第五节 数据核查与离群值 1. 测量或者记录过程中出现错误而导致离群值,或者存在明显的逻辑错误,应予以剔除。例如:细胞培养时出现了污染或者操作失误,这时的离群值应剔除。 2. 无明确理由剔除离群值 (1)对离群值删除前后各做一次统计分析,若前后分析结果矛盾则下结论需谨慎。 (2)采取一些稳健分析(robust analysis)的方法: ①中位数; ②对数变换:观测值大于0,夸大极小值的影响; ③截尾均数:是将数据按从小到大顺序排列后,两端截掉一定比例的数据后计算余下数据的均数。 第六节 分类变量的常用统计图 (一)饼图 第六节 分类变量的常用统计图 饼图(pie chart)又称圆图,是将圆形分割成若干个扇形,扇形面积的大小表示同一个事物内部中各部分的构成比。因此,饼图主要用来描述分类变量的构成比,用于说明事物内部各组成部分所占比重。 绘制饼图时应注意: 各扇形通常从时钟12时处开始,按大小或自然顺序顺时针方向排列; 简要注明各扇形所代表的类别和百分比。 (一)饼图 第六节 分类变量的常用统计图 有研究表明大骨节病的发生可能与粮食作物真菌污染

文档评论(0)

zsmfjh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档