网站大量收购独家精品文档,联系QQ:2885784924

[工学]北大描述统计课件.ppt

  1. 1、本文档共84页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]北大描述统计课件

描述统计 描述统计:描述一组数据的分布特征。 统计图表 条形图(棒图):表示分类变量等离散性数据资料 圆形图(饼图):表示分类变量等离散性数据资料 直方图:表示等比或等距变量等连续性数据资料 折线图:表示等比或等距变量等连续性数据资料 茎叶图:将每一数字分解为左边部分(称为茎)和右边部分(称为叶). 如果数字是两位数, 左边的一位就是茎,右边的一位就是叶 茎叶图兼具次数分布表和直方图的双重优点,有非常高的实用价值。 历年真题 等距量表的特点是(B)(2007,全国统考) A. 无绝对零点,无相同单位 B. 无绝对零点,有相同单位 C. 有绝对零点,无相同单位 D. 有绝对零点,有相同单位 次数分布表 简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编织成的统计表。 —————————————— 血型 人数 ————————————— A 143 B 182 AB 98 O 102 ————————————— 分组次数分布表:当数据量很大时,把所有数据先划分为若干组,将数据按数值大小划归到相应组别内,分别统计各组别中数据的个数,用列表形式呈现出来。 相对次数分布表:将次数分布表中各组的实际次数转化为频率比率(f/N)或百分比等项对此书来表示。 累积次数分布表:把各组次数由下而上或由上而下累加在一起。 双列次数分布表:又称相关次数分布表,把有联系的两列变量用同一个表表示其分布。 集中量数 集中趋势与离中趋势是次数分布的两个基本特征。 数据的集中趋势就是指数据分布中大量数据向某方向集中的程度。 用于描述数据集中程度的统计量,就是集中量数。 算术平均数、中数、众数、加权平均数、几何平均数、调和平均数等。 算术平均数 简称平均数(average)或均数、均值(mean) 表示:μ、M、、计算: 例:有一组数据如下,计算它们的平均数: 34,36,29,33,34,30 解:=(34+36+29+33+34+30)/6=32.67 特点: 1)在一组数据中每个变量与平均数之差(离差)的总和等于0。 2)在一组数据中,每个数都加上一个常数C,所得平均数为原来的平均数加常数C。 3)在一组数据中,每个数都乘上一个不为0的常数C,所得平均数为原来的平均数乘常数C。 意义: 1)应用最普遍的集中量数。 2)是“真值”最佳无偏的估计值。 优点: 1)反应灵敏。 2)计算简单、严密。 3)简明易懂。 4)便于进一步统计。 5)受抽样影响小。 缺点: 1)受极端值影响大。解决方法:修剪平均数,去除极端值。 2)不能有缺失值。用中数等代替 应用原则: 1)同质性。 2)平均数与个体数值相结合。 3)平均数与标准差、方差相结合。 中数 又称中点数、中位数、中值。数据排序后,中数刚好把数据的数目分成两半。 表示:Md或Mdn 计算:先将数据排序。 数据个数为奇数:中间位置(第 位置)的数就是中数。 例:有一组数据如下,计算它们的中数: 29,30,33,34,36 解:Md = 33 2)数据个数为偶数:位于中间的两个数的均值(第 和 位置数据的均值)就是中数。 例:有一组数据如下,计算它们的中数: 29,30,33,34,35,36 解:Md = 33.5 3)数据中间有数值相等的几个数:将中间重复的数看作连续体,利用中间分数的精确上下限进行插值。 例:有一组数据如下,计算它们的中数: 12,13,13,14,15,15,15,15,15,16 解:12,13,13,14,15,15,15,15,15,16 累积百分比中,第一个“15”的位置:40%,最后一个“15”的位置:90% 15的精确上下限:14.5,15.5。 ,15.5 – Md = 0.8,Md = 14.7 优点: 1)计算简单,容易理解。 2)不受极端值影响。 缺点: 1)没有利用全部数据。 2)不灵敏。 3)受抽样影响大,不稳定。 4)不能进一步代数运算。 应用:当观测值中有极端值、缺失值。快速估计数据的集中趋势。 众数 又称范数、密集数、通常数。在次数分布中出现次数最多的数值。 表示:Mo 计算:找在次数分布中出现次数最多的数值。 例:有一组数据如下,计算它们的众数: 34,36,29,33,34,30 解:Mo = 34 优点:

文档评论(0)

ipbohn97 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档