- 29
- 0
- 约1.02万字
- 约 85页
- 2019-04-28 发布于福建
- 举报
数据统计常见问题解析
数据统计的常见问题解析
马海燕
1 基本概念
总体
个体、个体变异
总体参数
未知
样本
代表性、抽样误差
随机
抽样
样本统计量已知
统计推断
I型误差、II型误差可信度
统计学中的几个基本概念
(一)总体与样本
1、总体(population): 根据研究目的确定的同质的所有观察单位某种变量值的集合,称为总体。
(1)无限总体
(2)有限总体
统计学中的几个基本概念
2、样本(sample) :从总体中随机抽取的一部分观察单位,称为样本,它是总体中有代表性的一部分。
举例: 调查某地1995年成年男子的红细胞数。该地1995年全部正常男子的红细胞数构成一个总体。从该地区随机抽取144名正常成年男子, 这144名正常成年男子的红细胞数就是样本。
——抽样误差
统计学中的几个基本概念
(
(二)参数与统计量
1、参数(parameter): 总体指标。、、。
2、统计量(statistic):样本指标。p、s、 x
(四)概率: 某随机事件发生可能性的大小, 用P表示, 必然事件概率为1, 不可能发生事件的概率为0, 一般事件概率为0~1。对总体而言。习惯上常将P0.05或P0.01称为小概率事件。
定量资料:亦称数量变量,其变量值是定量的,表现为数值的大小,一般有度量衡单位,如调查某地区10岁儿童的Hb值。
资料类型:
定量资料(quantitative data)
分类资料:亦称定性资料,其观察值是定性的,表现为互不相容的类别或属性,有两种情况:
二项分类
无序分类
多项分类
有序分类 病情严重程度 药物剂量
资料类型:
分类资料(categorical data)
误将定量资料判为定性资料从而误用χ2检验
原文题目:《小儿皮肤血管瘤雌、孕激素受体的研究》,原作者意在探讨雌激素受体(ER)、孕激素受体(PR)在血管瘤发生、发展中的意义。采用免疫组化方法对毛细血管瘤、混合型血管瘤、海绵状血管瘤、淋巴管瘤及正常皮肤组织的ER、PR受体进行检测。全部标本经10%福尔马林固定,常规石蜡包埋。每例选一典型蜡块,4~6μm切片,进行免疫组化染色,高倍镜下每例肿瘤区内计数500个细胞,计数ER、PR阳性细胞百分率.
统计方法用卡方检验?
分析:问题的关键在于,原作者的观察单位并不是细胞本身,而是每一个病例标本,原作者关心的是四种疾病病例标本和一组正常人标本的ER、PR阳性细胞率之均值是否相同,从每一个病例标本中得到的是ER和PR阳性细胞率,是一具体的数值,因而应属于定量资料。如果仅从资料的表面现象(有“率”)进行判断,而不考虑每一个数值的实际含义,没有从资料的本质上进行判断,很容易判断错误。
统计分析:统计描述+统计推断
对称分布 、s
表达和描述定量资料
偏态分布 M、Q
表达和描述分类资料: 相对数或率
统计分析:统计描述+统计推断
参数估计 :置信区间
统计推断
假设检验: 检验统计量
定量资料的统计分析
t
正态分布,满足方差齐性,优先选用参数检验法 U
F
数据的分布
分布类型不明确,不满足参数检验条件,用非参数检验
符号检验
秩和检验等
定量资料的统计分析
整理资料
频数表
统计描述
统计推断
集
原创力文档

文档评论(0)