网站大量收购独家精品文档,联系QQ:2885784924

02统计描述PPT.ppt

  1. 1、本文档共129页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
02统计描述PPT

医学统计学 ——统计描述;方法的 类型;在中医药科研实践中通过观察、调查、实验等方式搜集到的各种资料含有大量信息,由此揭示或表达样本信息特征,不仅需要依据相关专业知识,还需借助适当的统计学方法和手段。 统计描述(statistical description)又称描述性统计(descriptive statistics),是运用适宜的统计指标、统计表、统计图等方法,对研究对象(变量)的分布类型和数量特征进行展示的过程。 通过统计描述,可了解研究对象的基本特征,便于对样本资料作进一步的统计分析。;第一节 频数分布 第二节 数值资料的统计描述 第三节 分类资料的统计描述 第四节 统计表和统计图;第一节 频数分布;【例2-1】随机抽取某年某地120例正常人血清铜的含量,见表2-1,试编制频数表。;通过如下步骤也可手工编制表2-2。 (1)找出120例血清铁数据的最小值(9.23)与最大值(19.84)。 (2)计算全距(range,R),也称为极差。   R=最大值一最小值=19.84-9.23=10.61;(3)确定组段数(k):组段数应根据研究目的和观察值多少而定,当n100 时,一般定8~10个组;当n100时,通常取10~15组,不宜过粗或过细。本例n=120,可先将原始资料粗略定为11组。 (4)确定组距(i):组距等于全距比组数,一般等距分组。 i=R/k 本例中:i=10.61/11=0.965≈1 (5)确定组段:第一组段应包括最小值,最后一个组段应包括最大值。每一组段的起始值称为下限,终点值称为上限(即下一组段的下限),为避免汇总时的重复,组段不包括本组段的“上限”,但最后一个组段应同时写出下限和上限。如本例最小值为9.23 ,为计算方便,第一组段的下限取9.00 ,然后每隔一个组距列一个组段,直至最后一个组段19.00~20.00 。;( 6 )列表并统计频数,还可计算频率、累计频数和累计频率,见表2-2。;表中:组中值=(上组段下限值+下组段下限值)/2; 频数(frequency)即各组段内观察值的个数; 频率(percent)即各组段频数与总观察值个数之比,一般用百分数表示; 累计频数(cumulative frequency)是由上至下将频数累加; 累计频率(cumulative percent)是由上至下将频率累加。 从本例的分布可见:以第六组段(14.00~)分布的数据最多,22例,占18.3%,且以该组段为中心呈对称分布,小于15.00umol/L的数据占59.1%。;SPSS软件绘制频数表;;;2.分类资料频数表的编制 ;(2)二维频数表:分类资料的二维频数表在各种医学杂志中较为常见。按分类资料的分类水平特征,可组合成各种不同的二维表,不同二维表名称见表2-4 。;;;(3)配对设计分类资料的频数表:同一研究对象同时接受两种不同的处理,观测的结果为属性相同的分类资料时,这样就形成了配对设计的分类资料,可用行数与列数相同的方形表归纳其频数分布,见表2-5。;二、频数图;1 .数值资料频数图——直方图的绘制;;SPSS绘制频数图;(2)不等距分组:横轴表示变量,纵轴是每个横轴单位的频数。表2-6资料的频数图,见图2-2。 ;2.分类资料频数图——直条图的绘制;;;三、频数表和频数图的用途;;描述频数分布形态的统计量有两个: 峰度系数(coefficient of kurtosis ,KURT)和偏度系数(coefficient of skewness,SKEW)。 理论上总体偏度系数为0时,分布是对称的;取正值时,分布为负偏态;取负值时,分布为正偏态。 正态分布的总体峰度系数为0;取负值时,分布为平阔峰;取正值时,分布为尖峭峰。 正态分布是一种特殊的以集中性、对称性和均匀变动性为特点的对称分布,故无论尖峭峰或平阔峰,均为非正态分布。;2.展示频数分布的特征 频数分布有两个重要特征:一是集中趋势(central tendency),反映一组观察值的中心位置或平均水平;二是离散趋势(tendency of dispersion),反映观察值之间参差不齐的程度。对数值变量资料作统计描述,就是用统计指标将这两个重要特征数量化。 3.便于发现某些特大或特小的异常值 对资料中出现的异常值应谨慎对待,必要时对原始资料进行核实,并再次进行观察或测量。若条件不允许再次观察或测量,在有充分依据的前提下,可将异常值予以剔除,然后再做统计描述和分析。 4.有利于进一步计算有关指标和统计分析处理;第二节 数值资料的统计描述;一、集中趋势的统计描述;按使用条件和计算方法不同,平均数分为许多种。常用的有算术均数、几何均数和中位数等。 1.算术均数(arithmetic mean

文档评论(0)

djdjix + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档