数值变量的统计描述课程方案.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
回顾:;第九章 数值变量资料的统计分析;统计学描述:选用恰当统计量结合恰当统计图、表,描述资料的分布规律或数理特征。 统计学推断:样本→总体,统计量→参数。;第一节 数值变量资料的统计描述;群体特征的描述:一般先有一个变量,然后会有一系列的变量值,这些变量值就是一个群体。 针对这样一个群体,你想知道什么?(共性与特性,有群体就有变异) 同样是计量资料,但其特点又各不相同(分布问题:正态与非正态,计算均数时也不同) ; 对数值变量资料进行统计分析的一般步骤,是先对观察测量得到的变量值(即观察值)进行统计描述,再在此基础上进行深入的统计推断。   统计描述的工作主要是在编制频数表的基础上描述资料的集中位置和离散程度。;主要内容;一、数值变量资料的频数分布 ; 频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。 频数表(频数分布):表示各组及它们对应的组频数的表, 为频数表或频数分布。;例9.1 某地用随机抽样的方法对140名健康成年男性血清尿素氮(BUN)浓度进行检测,所得数据如下,请编制频数表和观察频数分布情况。;组距分组的几个概念; ;(3) 列出组段;(4)列表划记:采用划记法分别将原始资料中各变量值在频数表中列出来,并且统计各组段变量值的个数,即频数。;频数分布图;(二)、频数表和频数分布图用途;(1)对称分布 : 若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布;(2)偏态分布 :;正偏态分布;负偏态(左偏态);频数分布的类型;2.描述频数分布的特征;3.便于发现一些特大或特小的可疑值;二、集中趋势的描述 (★:掌握描述集中趋势指标的概念、计算和应用条件);常用的平均数有: 算术均数(均数)(mean) 几何均数(geometric mean) 中位数 (median) 百分位数(percentile);(一)、算术均数;1、计算方法;(2)加权法(利用频数表);组段;(二)、 几何均数(geometric mean);几何均数计算公式:;例9-3 有8份血清的某种抗体效价分别为1:200, 1:25, 1:400, 1:800, 1:50,1:100,1:50,1:25,求平均抗体效价。;2.加权法(当观察例数多时采用) ;例9-4 某地对112名儿童接种某种疫苗一个月后,测定了各儿童血清抗体滴度,结果如表9-4第(1)、(2)栏,试求平均滴度。;112人的血清平均抗体效价为1:48。;计算几何均数应该注意的事项 变量值中不能有0或负数,因为0和负数不能取对数。 不能同时有正有负。若全部是负值,计算时可先把负号去掉,得出结果后,再 加上负号。 ;(三)、??中位数与百分位数;(1)、直接法;例 7名正常人的血压(舒张压) 测定值(mmHg)为:72,75,76,77,81,82 ,86,求中位数。; ;(2).频数表计算中位数和百分位数;例 频数表中位数的计算; 百分位数示意图;公式:; 当 时,公式(9-7)即为中位数的计算公式:;血铅(umol/l);三种平均数的特点;反映集中趋势的指标(平均数),表示一组观察值的平均水及集中特性,并可作为总体的一个代表值加以应用。但是它没有表达其所代表的总体中各个个体之间的差异。 统计学中把个体间的差异称为变异性(variation)。所谓变异性是指在同质条件下的观察单位,其同一标志的数据间的差异性。 用以描述一组数值变量资料观察值之间参差不齐的程度,即离散程度或变异度的指标,称为离散指标或变异指标。;盘编号 ;常用统计指标:;全距,用R表示:即一组变量值最大值与最小值之差,亦称极差。对于书中例9-1数据,有;(二)四分位数间距(quartile range) ;优点:与极差相比,不受两端最大值,最小值的影响,比较稳定 缺点:没有考虑到每一个具体变量值的变异程度;全距和四分位数间距都未全面考虑观察值的变异情况,为了克服该缺点,需计算总体中每个观察值x与总体均数?的差值(x-?),称为离均差。;(60-72) ( 66-72) ( 72-72) (78-72) ( 84-72) ; 由于∑(x-?)=0,不能反映变异的大小,而用离均差平方和 ∑(x-?)2(sum of deviation from mean)反映。同时还要考虑到观察值个数 N 的影响,用其均数,即得到总体的方差,用?2表示。 公式为:;总体方差;自由度(degree of freedom);(四) 标准差(standard deviation);样本标准差用 表示 ,其度量单位与均数一致,所以最常用。; ;离散趋势的描述;例 对以下数据: 75,

文档评论(0)

bbnnmm885599 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档