统计学要点--终极版.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学要点--终极版

▲统计学的几个基本概念!! ▲统计学(statistics) ---是搜集资料、整理资料、分析资料,并且据此作出决策的一门学科。 ▲医学统计学(medical statistics) --- 是以医学 理论为指导,运用数理统计学的原理和方法研究医学资料的搜集、整理、分析,并且作出决策。从而掌握事物内在客观规律的一门学科 ▲同质(homogeneity) 是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童 ▲变异(variation) 由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别 ▲总体:根据研究目的而确定的同质观察单位的全体,同质的所有观察单位某种观察值的集合。 ▲样本:从总体中随机抽得的部分观察单位,其实测值的集合。 ▲参数(parameter):由总体计算或得到的统计指标称为参数。总体参数具有很重要的参考价值。如总体均数μ,总体标准差σ等 ▲统计量(statistic):由样本计算的指标称为统计量。如样本均数,样本标准差s等 ▲变异:不同个体不尽相同,这种个体间的差异。 ▲计量资料:又称定量资料或数值资料,为观测每个观察单位某项指标的大小而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。分连续型或离散型。 ▲计数资料:又称定性资料或无序分类变量资料,亦称名义变量资料。为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得的资料。 ▲等级资料:又称半定量资料或有序分类变量资料。为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。 ▲误差:泛指实测值与真值之差,按其产生原因和性质可分为随机误差与非随机误差两大类,后者又分为系统误差与非系统误差两类。 ▲抽样误差(sample error): 由于随机抽样所引起的样本统计量与总体参数之间的差异以及样本统计量之间的差别称为抽样误差。如样本均数与总体均数之间的差别,样本率与总体率的差别等。 ▲频率:在重复多次后,出现正面或反面这个结果的比例。 ▲概率:描述随机事件发生可能性大小的一个度量。(概率(probability):是描述随机事件发生可能性大小的量值。用英文大写字母P来表示。概率的取值范围在0~1之间。当P=0时,称为不可能事件;当P=1时,称为必然事件 ▲小概率事件:统计学上一般把P≤0.05或P≤0.01的事件称为小概率事件) 频数分布图:步骤:1、计算全距;2、确定组距;3、划分组段;4、统计频数;5、频率与累计频率。用途:①反映频数分布的类型(对称分布或偏态分布)。②描述频数分布的特征(集中趋势或离散趋势)。③便于发现极端值:如极大值、或极小值。④便于进一步进行统计分析。 ▲医学统计工作可分为四个步骤:1、统计设计(第一步也是关键一步);2、搜集资料(资料来源:统计报表,医疗卫生工作记录,专题调查或实验研究);3、整理资料(审核,分组,汇总);4、分析资料(统计描述,统计推断)。 ▲集中趋势 :反映一组数据的平均水平的指标。 (1)算术均数:应用条件:①正态分布的数据;②对称分布的数据。特点是容易受极端值影响。 (2)几何均数:适用条件:对于变量值呈倍数关系(等比资料)或呈对数正态分布。 (3)中位数:(定义)将一组变量值从小到大按顺序排列,位次居中的变量值称为中位数(median,简记为M)。应用条件:①偏态分布②分布不明③有极端值④有开口的资料。特点:不受极端值影响。 (4)百分位数:是一种位置指标,以Px表示。百分位数是将频数等分为一百的分位数。一组观察值从小到大按顺序排列,理论上有x%的变量值比Px小,有(100-x)%的变量值比Px大。故P50分位数也就是中位数,即P50=M 。 应用条件:①描述一组资料在某百分位置上的水平;②用于确定医学参考值范围;③计算四分位数间距。 (5)众数:一组观察值中出现次数最多的那个数值,条件:应用于任何分布。特点:可以没有也可以不止一个。 (6)调和均数:条件:适用于极度偏态分布的资料。调整均数:适用于两端有极端的。 ▲离散趋势:反映一组数据离散水平或变异程度的指标。 (1)极差:亦称全距,即一组变量值中最大值与最小值之差. 优点:计算简单方便,应用广范,容易理解。缺点:只反映两端数据最大最小值的差别,易受极端值的影响,不能反映组内其他变量离散情况。 (2)四分位数间距:Q=P75-P25。优点:不受极端值影响,比极差R稳定。缺点:计算繁琐、不易理解、只反映中间50%的数据的两端的差值 (3)方差(均方差)的特点:①充分反映了每一个数据与平均数的差别; ② 方差

文档评论(0)

kakaxi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档