04数值变量的统计描述1.ppt

  1. 1、本文档共115页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
04数值变量的统计描述1

评分 频数 累计频数 累计频率(%) 频率范围 0~ 2 2 0.91 0~0.91 30~ 2 4 1.83 0.92~1.83 40~ 3 7 3.20 1.84~3.20 50~ 11 18 8.22 3.21~8.22 60~ 30 48 21.92 8.23~21.92 70~ 63 111 50.68 21.93~50.68 80~ 60 171 78.08 50.69~78.08 90~100 48 219 100.00 78.09~100.00 表4.4 219名乳腺癌患者康复期生存质量评分 QU=80+10/60(219×75%-111)=88.88(分) Q= QU-QL =88.88-71.07=17.81 QL=70+10/63(219×25%- 48) =71.07(分) 例4.13 四分位数间距 四分位数间距interquartile range:上四分位数与下四分位数之差 IQR = QU – QL 反映数据离散程度,其值越大数据离散程度越大 体现了中间50%数据的离散程度,但是仍然没有考虑到每个观测值间的变异 受极端值的影响小,比极差稳定 特别适用于分布呈明显偏态;分布形态不清;分布一端或两端无确定数值的资料 常与中位数一起,综合描述数据的集中和离散趋势 离均差与离均差和: 为了克服全距、四分位数间距的缺点,人们考虑到用每个变量值与均数之间的差别来反映离散的程度,所以提出了离均差的概念,其数学表达式为 离均差可正可负,但是数学上可以证明 离均差与离均差和 离均差平方和与离均差平方和的平均值: 为了避免离均差和等于0的情况,人们考虑将离均差取平方后求其和,于是有了离均差平方和,其数学表达式为 前者称为SS总体,后者称为SS样本;但是SS不但和变异大小有关,还和观察值的个数有关,SS随观察例数增多而增大。为了解决这个问题,人们又引入了离均差平方和的平均值,其数学表达式为 离均差平方和与均方 方差 离均差平方和的平均值(MS),又可称为方差variance 它是反映数据离散程度的最常用的指标 在计算方差过程中利用到每个变量值,所以它表达的离散趋势信息比极差、四分位数间距更精确 但是由于在计算方差时用到算术均数,所以方差也只能用于反映对称或近似对称分布资料的离散趋势 总体方差通常用希腊字母s2 (sigma)表示,记作: 但是在实际研究中,通常只观察来自总体中的一个样本,所以总体均数是未知的;此时用样本均数作为总体均数的估计值,相应的方差称为样本方差,其公式为: ? ? 式中的 n-1 又称为自由度 总体方差与样本方差 自由度 自由度degree of freedom, df:一组数据中可以自由取值的数据的个数 当样本数据的个数为 n 时,若样本均值?x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值 例如,样本有3个数值,即x1=2,x2=4,x3=9,则 ?x = 5。当 ?x = 5 确定后,如果x1=6,x2=7,那么x3则必然取2,而不能取其他值 样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差S2去估计总体方差σ2时,它是σ2的无偏估计值(所有样本方差的平均值是总体方差) 标准差 在取方差的过程中,对离均差作了平方转换,这样方差的单位就是原观察值单位的平方,使用不方便 为了使得观察单位的平均数指标与变异程度指标具有相同的单位,通常将方差的算术平方根作为反映变异程度的一个重要指标,人们将它称为标准差standard deviation, SD 方差 (MS) 标准差 (SD) 样本 总体 方差 (MS) 标准差 (SD) 样本(x为组中值) 总体(x为组中值) 1985年通过十省调查得知,农村刚满周岁的女童体重均数为8.42kg,标准差为0.98kg;身高均数为72.4cm,标准差为3.0cm,试问身高与体重何者变异情况较大? 要反映变异程度本例题中宜采用标准差;从标准差的数值看来,身高变异程度大于体重。 是否合理? 身高的单位是cm,而体重的单位是kg,能否认为3cm0.98kg? 变异度间的比较问题 变异系数 变异系数coefficient of variation:标准差与其相应的均值之比 它反映数据相对离散程度,没有量纲 消除了数据水平高低和计量单位的影响,用于不同性质数据或均数相差较大时,离散程度的比较 频数分布表、图 分组划计

文档评论(0)

djdjix + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档