统计学精华版解析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学是收集、分析、解释与呈现数据资料的一门科学。 收集数据:实验设计、调查设计 分析数据:统计学描述、统计学推断 解释数据:根据专业等解释统计结果 呈现结果:向杂志社、上级部门发表结果 参数与统计量 parameter and statistic 参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数。 统计量:样本的统计指标,如样本均数、标准差,采用英文字母分别记为 。 参数附近波动的随机变量 。 误差及种类 误差指观察值与真实值之差 系统误差 在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为偏倚(bias)。 特点:观察值有系统性、方向性、周期性的偏离真值。 措施:可以通过严格的实验设计和技术措施消除。 过失误差: 由于观察过程中不仔细造成的错误判断或记录。 措施:应认真检查核对,否则将会影响研究结果的准确性。 随机测量误差: 各种偶然因素(电压、环境温度等)的影响造成同一对象多次测定的结果不完全一样。 或同一样品不同观察者之间的差异。该误差不可避免,但要控制在容许范围内。 措施:提高操作者熟练程度可以减少这种误差。 抽样误差: 在排除了系统误差,控制了随机测量误差后,由于抽样过程造成的样本指标与总体指标之间的差异。原因:个体差异的存在。 措施:该误差不可避免,但有一定的分布规律,可估计。 准确度精密度 准确度(accuracy)或真实性(validity) : 观察值与真值的接近程度,受系统误差的影响(常用指标:如灵敏度、特异度)。 可靠度(reliabiliy)—— 也称精密度(precision)或重复性(repeatability) : 重复观察时观察值与其均值的接近程度,受随机误差的影响(常用指标:一致百分率、Kappa值)。 举例说明统计资料的类型和不同类型资料间的相互转化 1、数值变量资料(计量资料)也叫定量数据 用仪器、工具等测量方法获得的数据 特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg) 2、分类变量资料(计数资料)也叫定性数据 按某种属性分类,然后清点每类的数据 特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、性别(男女) 3、等级资料 半定性或半定量的观察结果。有大小顺序,所以也叫有序分类资料 如癌症分期:早、中、晚。药物疗效:治愈、好转、无效、死亡。 尿蛋白: (、(、(、++、+++及以上 各类变量间的互相转化: 有序分类变量转化为数值变量: 如:治愈3、显效2、好转l、无效0 数值变量也可转化为分类变量: 如:按血压测量值大小将血压分为:低血压、正常、高血压 变量及其分类 连续性变量(continuous variable) 相当于计量资料 离散型变量(discrete variable) 相当于计数资料 有序变量(ordinal variable) 相当于等级资料 注:a、虽然如脉搏、白细胞计数等测量值只能是正整数,但为研究方便习惯上也视为连续变量。 b、各类变量间的互相转化。 统计工作的基本步骤- -单选 or 简答 设计design 按是否对研究对象施加干预分为:实验设计和调查设计 实验设计必须遵循的基本原则: 随机化原则(randomization) 对照原则(control) 重复原则 (replication) 医学论文统计设计方面存在的常见问题: 组间的可比性问题 对照的设立问题 样本含量的问题 样本代表性问题 搜集资料data collection 整理资料data sorting 使原始数据条理化,便于进一步的计算和分析。 1、对资料进行检查、核对 2、设计分组:质量分组、数量分组 3、按分组要求设计整理表。 分析资料data analysis 按设计的要求,根据研究目的和资料的类型,对整理出的基础数据作进一步的计算分析和统计处理,并用适当的统计图表表达出来,最后结合专业做出结论。 频数分布的类型 对称分布:集中位置居中,左右两边对称 偏态分布:正偏态分布(右偏态)峰左尾右 负偏态分布(左偏态)峰右尾左 计量资料集中趋势和离散趋势的主要统计指标及其适用范围=频数分布的两个特征 集中趋势:指变量值的中心数值或中心位置所在。 平均数: a.算术均数or均数:反映一组观察值在数量上的平均水平。 适用 主要用于对称性或近似对称性分布的资料; 尤其是在正态分布或近似正态分布上的应用。 均数的两个重要特征 离均差之和为零 离均差平方和为最小 b.几何均数:反映一组呈倍数关系的观察值的平均水平 适用:数据呈正偏态分布,经对数转换后

文档评论(0)

四娘 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档