- 1、本文档共75页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主观感觉指标:如疼痛、恶心、食欲不振 等 主观数据 避 免 误 差 为获得较准确的结果,应实施严格的质量控制: 方法的标准化 仪器的校正 数据的校验 资料整理 数据录入:数据库文件Epi info、dBASE、FoxBASE、Lotus;Excel文件等; 数据核查: 专业检查:男性患者的调查表中不应出现妇科疾病等;从专业的角度对资料的一致性进行检查,比如诊断和疗效的评定标准是否统一,胃镜下萎缩性胃炎的严重程度的评定标准是否一致等。 逻辑检查:比如退休时的年龄不应出现小于20岁 ;六岁的孩子不应有大学文化程度。 统计检查:检查报表(或报告卡)的纵向,横向的合计和总的合计是否吻合。 体重8.5(公斤),身高69.0 (cm),头围44.0 (cm),胸围42.5 (cm),坐高43.0 (cm)。 理论上算,这五个数据都是以0或5结尾可能性0.032% 资料整理 数据的真实性:双人双次录入;利用统计图; 数据离群值的识别:离群值是指各变量中与整体数据相距太远的极值, 由于它的夸大作用, 常常会歪曲统计结果, 导致犯一类和二类错误. 利用统计图:散点图、柱状图、箱丝图、茎叶图、正态检验的Q~Q图等检测. 不符合逻辑的要剔除;剔除前后进行分析比较; 利用散点图查找异常值 BMI与年龄的散点图 BMI的直方图的分布 已知总体分布类型,对未知参数进行统计推断 依赖于特定分布类型,比较的是参数 参数检验 (parametric test) 非参数检验 (nonparametric test) 对总体的分布类型不作严格要求 不受分布类型的影响,比较的是总体分布位置 优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值“50mg”等 ) 缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同 案例 适应期: 干预期 实验区 对照区 对照区 实验区 数据 实验区 对照区 适应期 13 15 15 16 11 13 12 12 18 干预期 23 20 26 21 28 19 29 32 22 20 区域 时间 参数 对照区 适应期 15 16 13 12 18 干预期 20 21 19 32 实验区 适应期 13 15 11 12 干预期 23 26 28 29 22 20 广义评估方程(GEE) 广义线性模型,是为了克服线性回归模型的缺点出现的,是线性回归模型的推广。 首先自变量可以是离散的,也可以是连续的。离散的可以是0-1变量,也可以是多种取值的变量。 与线性回归模型相比较,有以下推广: (1)随机误差项不一定服从正态分布,可以服从二项、泊松、负二项、正态、伽马、逆高斯等分布,这些分布被统称为指数分布族。 (2)引入联接函数g(?)。因变量和自变量通过联接函数产生影响,即Y=g(Xβ),联接函数满足单调,可导。常用的联接函数有恒等(Y=Xβ),对数(Y=ln?(Xβ)),幂函数(Y=(Xβ)k),平方根(Y=Xβ),logit(ln?(Y1?Y)=Xβ)等。根据不同的数据,可以自由选择不同的模型。大家比较熟悉的Logit模型就是使用Logit联接、随机误差项服从二项分布得到模型。 广义估计方程(GEE)是在广义线性模型的基础上发展的,可以克服样本的非独立问题 谢 谢 * * * * * * * * * * * * 调查过程中由调查员依据方便的原则,自行确定入抽样本的单位 调查员在门诊等公共场所进行拦截调查 优点:容易实施,调查的成本低 缺点:样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体 方便抽样(随意抽样) 判断抽样 判断抽样(Judgement sample)又称“立意抽样”,是指根据调查人员的主观经验从总体样本中选择那些被判断为最能代表总体的单位作样本的抽样方法。 优点:简便易行,符合调查目的和特殊需要,可以充分利用调查样本的已知资料,被调查者配合较好,资料回收率高等优点。适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下。 缺点:该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对调查总体进行推断。 自愿样本 被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息 例如,参与前列腺癌的研究,主动联系研究者要参与该项研究的,都属于自愿样本 自愿样本与抽样的随机性无关 样本是有偏的 不能依据样本的信息推断总体 判断抽样 研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本;
文档评论(0)