- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数值变量资料.ppt
第八章 数值变量资料 的统计描述 第一节 数值变量资料的频数分布 统计描述:是用统计图表、统计指标来描述资料的分布规律及其数量特征。 频数分布表:主要由组段和频数两部分组成的表格。 一、频数分布表及其制作 ---- 频数分布表的编制 1.计算极差(全距): R=最大值 - 最小值 R=5.59–3.60 =1.99(mol/L) 2.决定组数、组段和组距 根据研究目的和样本含量n确定分组组数。一般分为8~15组。 相邻两组段下限值之差称组距,i =全距 / 组数。 i = 1.99 / 10 = 0.199 ≈0.2 (mol/L) 组段:每个组段的起点称组下限,终点称组上限。 3.列表划记: 用划记法将所有数据归纳到各组段,可得到各组段的观察单位数(频数) 频数: 将所有变量值通过划记逐个归入相应组段 ; 频率与累计频率: 将各组的频数除以n所得的比值被称为频率。累计频率等于累计频数除以总例数。 二、频数分布的特征和类型 (一)频数分布的特征 1.集中趋势:变量值集中分布的位置。 2.离散趋势:变量值围绕集中位置的分布情况。 二、频数分布的特征和类型 (二)频数分布的类型 1.对称分布 2.偏态分布 三、频数分布表的用途 1.揭示资料的分布类型 2.观察资料的集中趋势和离散趋势 3.便于发现某些特大或特小的可疑值 4.便于进一步计算统计指标和作统计处理 3.便于发现一些特大或特小的可疑值 第二节 集中趋势指标 平均数常用于描述数值变量资料的集中趋势,是反映同质资料的平均水平或集中位置的特征值。 一、 算术均数(均数) ﹡表示符号:总体均数 (μ) 样本均数 ( x ) ﹡应用:对称分布资料,尤其是正态分布资料。 2.加权法:用于变量值个数较多时。 计算结果 二、几何均数 几何均数(简记为G):是将n个观察值x的乘积再开n次方的方根(或各观察值x对数值均值的反对数)。 适用条件:对于变量值呈倍数关系或呈对数正态分布(正偏态分布),如抗体效价及抗体滴度,某些传染病的潜伏期,细菌计数等。 二、几何均数 例8.3 有7份血清的抗体效价分别为1:2, 1:4, 1:8, 1:16, 1:32, 1:64,1:128,求平均抗体效价。 平均抗体效价1:16。 二、几何均数 计算几何均数注意事项: ①变量值中不能有0,因为0和负数不能取对数。 ②不能同时有正值和负值; ③若全是负值,计算时可先把负号去掉,得出结果后再加上负号。 三、中位数 定义:将一组变量值从小到大按顺序排列,位次居中的变量值称为中位数(简记为M)。 三、中位数 适用条件: ①变量值中出现个别特小或特大的数值; ②资料的分布呈明显偏态,即大部分的变量值偏向一侧; ③变量值分布一端或两端无确定数值,只有小于或大于某个数值; ④资料的分布不清。 三、中位数 三、中位数 四、百分位数 (Px ) 定义:百分位数是一种位置指标,以Px表示。百分位数是将频数等分为一百的分位数。 一组观察值从小到大按顺序排列,理论上有x%的变量值比Px小,有(100-x)%的变量值比Px大。故P50分位数也就是中位数,即P50=M 。 计算公式: 计算中位数及百分位数的步骤: 先找到包含Px的最小累计频率; 该累计频率同行左边的组段值为L; L同行右边的频数为fx(或fm); L前一行的累计频数为∑fL; 将上述已知条件代入公式计算Px或P50 。 第三节 离散趋势指标 离散度(变异度):一组同质计量资料各数据之间参差不齐的程度,称为离散度。 常用指标: 一、全距 (R) R = 最大值 — 最小值 反映变量值的变异范围。 全距越大,说明变量的变异程度越大。 其度量单位与原变量单位相同。 二、四分位数间距 (Q) 四分位数间距为特定的百分位数,可看作为中间1/2变量值的全距。 Q = Qu - QL Qu = P75 (上四分位数) QL = P25(下四分位数) 二、四分位数间距 (Q) 用途:用于表示偏态分布资料的变异程度,常与中位数配合使用。 三、方差和标准差 全距和四分位数间距都未全面考虑观察值的变异情况,为了克服该缺点,需计算总体中每个观察值x与总体均数?的差值(x-?),称为离均差。 由于∑(x-?)=0,不能反映变异的大小,而用离均差平方和 ∑(x-?)2反映。其均数,即得到总体的方差,用?2表示。 2.标准差 方差可以比较全面地反映变量值的变异情况,但其方差的单位是原单位的平方,故引入标准差的概念。 标准差:将方差开平方,恢复成原度量单位,得到总体的标准差?和样本标准差S。 总
文档评论(0)