- 1、本文档共110页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对统计数据进行排序、分组、整理,是对数据的分布特征进行描述的一个基本方面,为进一步掌握数据分布特征及其变化规律,以进行深入的分析,还需找出反映数据分布特征的各个代表值。 统计学中刻划数据分布特征的最主要的代表有二:数据分布的集中趋势与数据分布的离散程度。 该项活动中,每月都有数据统计及分析以用来进行该项活动的调整与实施。 如:有一组关于病人进入“救助”活动的时间长度的数据: 67个样本:时间长度从1天到185天。 均值(mean):35.7天; 中位数(median):17天; 众数(Mode):1天 Interpretation: (1) the average time a patient stays in the Program is 35.7 days, or slightly over a month; (2)half of the patients are in the Program 17 days or less and half are in the Program 17 days or more; (3) many patients have a short day in the Program. 思考题 比特啤酒公司雇用了468名员工,其中有56名管理人员,130名行政和技术人员,其余282人是工人。这三组人的周平均工资分别是500英镑、300英镑和200英镑。财务主管希望计算全体员工的平均工资。 正确的计算方法 如果统计资料中含有异常的或极端的数据,就有可能得到非典型的甚至可能产生误导的平均数,这时使用中位数来度量集中趋势比较合适。 比如有5笔付款: 9元,10元,10元,11元,60元 平均付款为100/5=20元。 很明显,这并不是一个好的代表值,而中位数10元是一个更好的代表值。 众数、中位数和均值都是对数据集中趋势的测度, 1、均值由全部数据计算,包含了全部数据的信息,具有良好的数学性质,当数据接近对称分布时,具有较好的代表性;但对于偏态分布,其代表性较差。 2、中位数是一组数据中间位置上的代表值,不受数据极端值的影响,对于偏态分布的数据,其代表性要比均值好。 3、众数是一组数据分布的峰值,是一种位置的代表,当数据的分布具有明显的集中趋势时,尤其对于偏态分布,众数的代表性比均值好。 4、对接近正态的分布数据,常用均值描述数据的集中趋势;对偏态分布,常用众数或中位数描述数据的集中趋势。 5、均值只适用于定距或定比尺度的数据;定序尺度数据可用中位数或众数进行描述,而对定类尺度数据,只能用众数进行描述。 众数、中位数和均值的关系 例:如果你是一家制造业公司的供应部门经理,与两家原材料供应商联系供货,两家供应商均表示能在大约10个工作日内供齐所需原材料。几个月的运转之后,你发现尽管两家供货商供货的平均时间都是大约10天,但他们供货所需天数的分布情况却是不同的(图)。 异众比率(概念要点) 1. 离散程度的测度值之一 2. 非众数组的频数占总频数的比率 3. 计算公式为 异众比率(算例) 动差又称矩,可用来说明数据频数分布的特征。 一般地,取数据中的a点为中心点,所有数据与a之差的k次方的平均数: 峰度是频数分布的另一重要特点。 其测度的是: 某种频数分布的曲线与正态分布曲线相比,是尖顶,还是平顶,其尖或平的程度如何。 峰度就是频数分布曲线顶端的尖峭程度。 峰度的测度,往往以中心4阶动差为基础进行; 将4阶动差的数值,除以标准差的4次方,化为相对数,就是峰度的测度值,即峰度系数: 偏态(实例) 偏态与峰度(从直方图上观察) 偏态系数(计算过程) 偏态系数(计算结果) 峰度系数 是非标志总体的指标 均 值 标 准 差 《统计学》第五章 变量数列分析 是非标志总体的指标 方差 标准差系数 《统计学》第五章 变量数列分析 【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。 是非标志总体的指标 解: 《统计学》第五章 变量数列分析 §5.3 分布偏态与峰度 一、偏态及其测度 二、峰度及其测度 称为数据X关于a的k阶动差(k阶矩)。 当 时,数据以算术平均数为中心,上式称为中心k阶动差(矩)。 一、统计学中常 以中心3阶动差(矩)来测度分布的偏态。 动差法 当a=0时,即数据以原点为中心,上式称为原点k阶动差
文档评论(0)