数值变量的描述性统计.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

*第60页,共88页,星期日,2025年,2月5日*3.一般正态分布曲线下的面积对于一般的正态分布N(?,?2),其曲线下(-?,x)区间的面积除与x有关外,还与?和?有关。即不同的正态曲线,由于其位置和形状不同,同一区间内的面积是不同的。但可利用标准正态变换,将N(?,?2)转化为标准正态分布,再根据标准正态曲线下的面积分布表推算。第61页,共88页,星期日,2025年,2月5日*1.求u值当、和已知时,按求得值;当、未知且样本含量n足够大时,可用样本均数和标准差分别代替和求得u的估计值。2.查u值表根据所求的u值查表。查u界值表的步骤:第62页,共88页,星期日,2025年,2月5日*集中趋势的描述指标---中位数---频数表法第28页,共88页,星期日,2025年,2月5日*例:分别取甲、乙、丙三人每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3)2.3离散趋势甲乙丙第29页,共88页,星期日,2025年,2月5日*全距(range,简记为R)亦称极差。定义:指一组同质观察值中最大值与最小值之差。全距反映了个体差异的范围:全距大,说明变异度大;反之,全距小,说明变异度小。应用:简单明了。常用于说明传染病、食物中毒等的最短及最长潜伏期。公式:R=xmax-xmin不足:①仅考虑了最大值与最小值之差,不能反映组内其它观察值的变异度;②样本含量越大,抽到较大或较小观察值的可能性越大,故全距可能越大。因此,样本含量相差悬殊时不宜用全距比较。一、全距第30页,共88页,星期日,2025年,2月5日*二、百分位数百分位数(percentile)用表示,0x100,是描述一组数据某百分位的位置指标。将全部观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大。最常用的百分位数是,即中位数。应用:①常与中位数结合应用,可以描述一组资料在某百分位置上的水平,也可以描述资料的分布特征。M-P5=P95–M时,分布近似对称M-P5P95–M时,分布呈正偏态M-P5P95–M时,分布呈负偏态第31页,共88页,星期日,2025年,2月5日*百分位数(percentile)应用:②也可用多个百分位数的结合来描述一组观察值的分布特征,如和合用时,反映中间50%观察值的分布情况;③百分位数可用于确定非正态分布资料的医学参考值范围。注意:应用百分位数,样本含量要足够大,否则不宜取靠近两端的百分位数。计算公式:分别为所在组段的下限、组距和频数;为小于L的各组段的累计频数。第32页,共88页,星期日,2025年,2月5日*百分位数第33页,共88页,星期日,2025年,2月5日*定义:四分位数间距(quartileinterval,Q)为上四分位数与下四分位数之差(或与之差)。计算公式:应用:用于描述偏态分布以及分布的一端或两端无确切数值资料或分布类型未知资料的离散程度。三、四分位数间距QLQMQU25%25%25%25%第34页,共88页,星期日,2025年,2月5日*四分位数间距包括了一组观察值的一半,故可把四分位数间距看成是中间50%观察值的极差。意义:Q越大,变异度越大;反之,Q越小,变异度越小。特点:由于四分位数间距不受两端个别极大值或极小值的影响,因而它较全距稳定,但仍未考虑全部观察值的变异度。离散程度的描述指标---四分位数间距第35页,共88页,星期日,2025年,2月5日*极差和四分位数间距都只考虑了个别观察值的大小差异,没有全面反映每个观察值的变异程度。就总体而言,即应考虑总体中每个观察值与总体均数的差值(),即离均差。因离均差之和,不能反映变异度的大小,故用离均差平方和(sumofsquaresofdeviationsfrommean)反映之。离均差平方和的大小除与变异度有关外,还与变量值的个数N有关。为了消除这一影响,取离均差平方和的均数,称方差(vari

文档评论(0)

xiaozhuo2022 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档