第四讲+计量资料的统计描述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
四分位数 定义 将全部数据等分成四个部分,每一部分均包含了25%的数据,25%、50%和75%分位点上的数值就是四分位数(Quartile, Q) 25%位点上的数值称之为下四分位数,记作Q1 75%位点上的数值称之为上四分位数,记作Q3 计算方法 间接法(频数表法) 软件法(最常用) 中位数、四分位数SAS程序 data tmp; input x@@; cards; 2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26 ; proc means median q1 q3 p5 p95 p99 maxdec=2; run; 众数 定义 一组数据中频数最大的变量值,即最普遍、最常出现的数值,记作M0 特点 位置代表值 能够直观的反映数据的集中趋势 不受数据中极端值的影响 代表性不好(未考虑其它数据的影响) 众数 计算方法 分类资料 对数据分组整理、频数最大的组即为众数组,该组对应的变量值(类型)即为众数。 如商场中某一时期销售量最大的商品 计量资料 列出频数表 频数最大的组即为众数组,该组对应的值即为众数 调和平均数 定义 先求出各变量值倒数的平均值,然后再求出该平均值的倒数,所得到的最终结果即为调和平均数(Harmonic Mean, H),即例数平均数 计算方法 直接法(适用于例数较少的数据) 间接法(频数表,适用于例数较多的数据 软件法(最常用) 众数、中位数与均数的比较 众数、中位数与均数的比较 共同点 三者均是描述数据集中趋势的常用指标 不同点 众数常用于品质型数据,一组数据中可有多个众数,不受异常值影响, 中位数适用于各种分布类型的数据,一组数据中只有一个中位数,亦不受异常值的影响 均数常用于对称分布类型的数据,一组数据中亦只有一个均数,代表性最佳,受异常值影响 第三节 离散趋势 定义 一组数据远离其中心的现象,称之为离散趋势或离散程度(与均数的代表性呈反比,即离散程度越大,均数的代表性就越差) 原因 由于遗传、营养、行为、发育、心理的各种因素的影响,同一总体中的个体之间又普遍存在着各种差别,即不同个体之间的变量值都不会完全相同(个体间存在差异),从而呈现出不同程度的离散趋势。 第二节 离散程度 离散趋势 第三节 离散趋势 常用指标 全距(Range, R),又叫极差 四分位数间距(Quartile Deviation, QL~QU) 方差(Variance, ?2或S2) 标准差(Standard Deviation, ?或S) 变异系数(Coefficent of Variation, CV),又叫离散系数 第三节 离散趋势 极差 R=max-min 容易计算 易受极端值的影响,适用性不强 除了最大、最小值外,不能反映组内其他数据的变异度。 样本例数越多,抽到较大或较小变量值的可能性越大,因而极差可能越大。 即使样本含量相同,极差也不够稳定。 第三节 离散趋势 四分位数间距 Q=Q3-Q1=QU-QL 反映了50%数据的离散程度 不受极端值的影响 适用于各种类型的连续型变量,特别是偏态分布的资料 不足之处在于未考虑另外50%数据对离散程度的影响 第三节 离散趋势 方差 ?2=?(X-?)2/N或S2=?(X-X)2/(n-1) 考虑了每一个变量值的影响 适用于描述对称分布资料的离散程度 不足之处在于度量衡单位与原单位不同 第三节 离散趋势 标准差 计算方法 直接法(适用于例数较少的数据) 间接法(频数表法,适用于例数较多的数据) 软件法(最常用) 总体标准差 样本标准差 第三节 离散趋势 应用 描述符合正态分布类型数据离散程度的最佳指标 结合均数计算变异系

文档评论(0)

xiaohuer + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档