- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 描述数据:如何用少量数字概括数据
⑵ n为偶数时,则中间位置的两个标志值的算术平均数为中位数。 所以 以某车间100个工人按日产量编成变量数列的资料: 计算σ的一般步骤: 1、偏度:衡量分布不对称程度,或偏斜方向、程度的指标。 2、计算公式: 当 =0时,左右完全对称,为正态分布;当 0时为正偏斜;当 0时为负偏斜。 1、峰度:用以衡量频数分配的集中程度,即分布曲线的尖峭程度的指标。 2、计算公式: 峰度指标β=0,分布为正态峰度,当峰度指标β0时,表示频数分布比正态分布更集中,分布呈尖峰状态,β0时表示频数分布比正态分布更分散,分布呈平坦峰。如图所示: 标准差,是总体各单位标志值与其平均数离差平方的平均数的平方根,故又称“均方差”。标准差的平方称为方差。 概念和计算: 标准差 (σ) ① 算出每个变量值对平均数的离差; ② 将每个离差平方; ③ 计算这些平方数值的算术平均数; ④ 把得到的数值开平方,即得到σ。 5898.8236 -17.62 65 19 60- 70 2903.9184 -7.62 75 50 70- 80 203.9184 2.38 85 36 80- 90 36172.5616 - - 164 合 计 8387.7152 32.38 115 8 110以上 7012.1016 22.38 105 14 100-110 4138.1388 12.38 95 27 90-100 7628.644 -27.62 55 10 50- 60 组中值 X 工人数(人) f 工人按日产量分组(千克) 例 如果对组距式数列计算标准差,则各组的变量值 用其组中值代替. 说明: 一般采用如下简洁公式: 这是因为: 变异系数,也称为离散系数,是平均差或标准差与平均数的比率。反映总体各单位标志值的相对变异程度.常用的标志变异系数: 变异系数 Vσ 平均差系数: 例 偏度 偏度与峰度 Ⅰ(α=0) II(α0) Ⅲ(α 0) 峰度 Ⅱ(β0) Ⅰ(β=0) Ⅲ (β0) * 莎士比亚的作品是否真的是莎士比亚写的? 美国一般家庭有多少个孩子? 一颗“正常的”心脏平均每分钟跳动多少下? 一般新娘和新郎在结婚时年龄是多少? 平均每年有多少人死于肝硬化? 怎样将一个变量的多个观察汇总为一个数值,并且 使这个数值具有原数据的中心趋势或平均值。是否可 能找到一个描述所有观察值都可能接近的一个数值呢? 第三章 描述数据:如何用少量数字概括数据 第一节 集中趋势的数字特征 计算汇总值有一个主要优点和一个主要缺点: 优点:汇总值会使数据高度的简单化; 缺点:任何的简单化都意味着某些信息的丢失。 通过直观的数据表示,数据的汇总计算势必要打 破简单化的获得与数据丢失之间的平衡。但这样做 并不简单,这就需要我们了解对各种常用的汇总数据 的优点和缺点的知识。 让我们数数有几种? 各种平均数: 是一个数值,是对 一个变量的观察值 进行计算后得到的。 我们有好多种平均数,为了探索其多样性,请 大家来认真看看下面的例子: 当代美国的平均人是女人,平均每个女人有2.1个 孩子,且这些女人住在平均价值为$80000的房子中。 这句话中分别用了三种平均值,你能分辨出它们 有何不同吗? 平均指标有两个特点: 一、它是一个代表值,代表了总体各单位某一 数量标志的一般水平; 二、它是一个抽象值,是总体各单位某一标志 值的差异相互抵消的抽象结果,反映了总体的综合 数量特征。 平均指标是反映总体各单位标志值集中趋势 的统计指标。 众数 :“最多”的宿主 性别变量只有两个值,男和女。在美国妇女比男 子人数多。所谓平均人口是女人的说法应用了一种 叫做众数的统计平均。 就是指一个变 量中出现次数 最多的数的值。 其适用情形:分类变量,特别是那些有许多个 值的分类变量。如宗教,种族,社会阶级等。 1.众数的概念 60 2.40 140 3.00 300 合计 80 4.00 20 2.00 销售数量 (千克) 价格 (元) 某种商品的价格情况 众数M0=3.00(元) 例 2.众数的计算方法 △ 众数的特点 众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受各单位标志值的影响,从而增强了对变量数列一般水平的代表性。不受极端值的影响,且众数值只能传递这个数据集中的信息的很少一部分。
文档评论(0)