- 1、本文档共70页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[高等教育]第3章 数据分布特征的描述
第三章 数据分布特征的描述 第一节 统计变量集中趋势的测定 第二节 统计变量离散程度的测定 第三节 变量分布的偏度与峰度 统计数据经过整理和显示后,对数据分布的形状和特征就可以有一个大致的了解。为进一步掌握数据分布的特征和规律,进行更深入的分析,还需要找到反映数据分布特征的各个代表值。 对一组数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢和聚集的程度;二是分布的离散程度,反映各数据远离中心值的趋势;三是分布偏态和峰态,反映数据分布的形状。这三个方面分别反映了数据分布特征的不同侧面。 §1 统计变量集中趋势的测定 一、测定集中趋势的指标及其作用 集中趋势(Central tendency) 较大和较小的观测值出现的频率比较低,大多数观测值密集分布在中心附近,使得全部数据呈现出向中心聚集或靠拢的态势。 测定集中趋势指标的作用 1.反映变量分布的集中趋势和一般水平。 如用平均工资了解职工工资分布的中心,反映职工工资的一般水平。 2.可用来比较同一现象在不同空间或不同阶段的发展水平。 不受总体规模大小的影响, 在一定程度上使偶然因素的影响相互抵消。 3.可用来分析现象之间的依存关系。 如研究劳动者的文化程度与收入的关系 4.平均指标也是统计推断中的一个重要统计量,是进行统计推断的基础。 二、数值平均数 (一)算术平均数(均值) 一组数据的总和除以这组数据的项数所得的结果; 最常用的数值平均数。 1.简单算术平均数 把每项数据直接加总后除以它们的项数。 通常用于对未分组的数据计算算术平均数。 计算公式: 例 3-1 分组数据不能简单平均 !因为各组变量值的次数不等! 2.加权算术平均数 加权算术平均数的计算公式: 权数(fi ,也称权重) 权数——指在计算总体平均数或综合水平的过程中对各个数据起着权衡轻重作用的变量。 可以是绝对数形式,也可以是比重形式(如频率)来表示。 事实上比重权数更能够直接表明权数的权衡轻重作用的实质。 当权数完全相等(f1 =f2 =…= fn)时,加权算术平均数就成了简单算术平均数。 3.由组距数列计算算术平均数 要点: 各组变量值用组中值来代表。 假定条件是各组内数据呈均匀分布或对称分布。 计算结果是近似值 . 4.对相对数求算术平均数 由于各个相对数的对比基础不同,采用简单算术平均通常不合理,需要加权。 5.算术平均数的主要数学性质 (1)算术平均数与变量值个数的乘积等于各个变量值的总和。 (二)调和平均数(Harmonic mean) 调和平均数也称为倒数平均数。 各变量值的倒数(1/xi)的算术平均数的倒数. 其计算公式为: (续) 调和平均数是算术平均数的变形,在实际工作中,由于所获得的数据的不同,有时不能直接采用均值的计算公式来计算平均数,这就需要使用调和平均数的形式进行计算,二者实质上是相同的,而仅有形式上的区别。即当已知各组变量值 xi 和算术平均数的分子数据(xi fi)而缺乏其分母数据(fi)时,加权算术平均数通常可变形为调和平均数形式来计算。 需要注意的是,当数据中出现“0”时不宜计算调和平均数。 (三)几何平均数(Geometric mean) 几何平均数— n个变量值连乘积的n次方根。 简单几何平均数 【例3-5】 某企业产品的加工要顺次经过前后衔接的五道工序。本月该企业各加工工序的合格率分别为88%、85%、90%、92%、96%,试求这五道工序的平均合格率。 解:本例中各工序的合格率具有环比的性质,企业产品的总合格率等于各工序合格率之连乘积。所以,所求的平均合格率应为: 三、众数与中位数 (一)众数(Mode) 众数是一组数据中出现频数最多、频率最高的变量值,常用 Mo 表示。 如表3-2中年龄的众数值MO=25。 众数代表的是最常见、最普遍的状况,是对现象集中趋势的度量。 可用来测度定性变量的集中趋势; 销售量最大的产品颜色是“白色”,则有M0=“白色” 可以度量定量变量的集中趋势。 从分布曲线的角度看,众数就是变量分布曲线的最高峰所对应的变量值。 从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的变量值即为众数。当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可能不存在;如果有两个最高峰点,也可以有两个众数,见P55图3-1。 组距数列中众数的确定 先找到众数组。 在等距数列中,众数组就是次数最多的组; 在异距数列中,众数组应是频数密度最大的组。 根据众数组与其相邻两组的次数差来推算。 其近似公式为: (二)中位数(Median) 中位数是将数据由小到大排列后位置居中的数值。 由组距数据计算中位数 先确定中位数组,即中间位置(用Σf/2来计算)所在的组。 假
您可能关注的文档
- [物理]第06章 电力系统三相短路电流的实用计算.ppt
- [物理]第五章计算智能.ppt
- [物理]配电自动化系统4.ppt
- [物理]铁碳相图.ppt
- [物理]第8部分 扫描电镜及透射电镜.ppt
- [物理]第02章插补原理.ppt
- [理化生]20l3高三复习课件:物质的量.ppt
- [理化生]44牛顿第二定律粤教版必修1_2013高一物理课件PPT14.ppt
- [理化生]13动能定理.ppt
- [理化生]有机合成和推断2012-9.ppt
- 2025安徽芜湖市南陵金谷粮油收储有限公司校园招聘拟聘笔试历年参考题库附带答案详解.pdf
- 2025年综合类-造价工程师(建设部)-造价工程师(建设部)-第三节安装工程常用管件和历年真题摘选带.docx
- 2025广东广州宽带主干网络有限公司校园招聘笔试历年参考题库附带答案详解.pdf
- 2025广西建工集团三建公司招聘7人笔试历年参考题库附带答案详解.pdf
- 2025浙江金华智尚人才开发有限公司招聘笔试历年参考题库附带答案详解.pdf
- 2025华能云南滇东能源有限责任公司矿业分公司高校毕业生招聘4人笔试历年参考题库附带答案详解.pdf
- 2025年公安消防职业技能考试-消防中介人员资格考试历年参考题库含答案解析(5套共100道单选题合辑.docx
- 2025江西吉安市人才发展集团招聘外包人员6人笔试历年参考题库附带答案详解.pdf
- 2025年郑州航空大都市研究院有限公司下属公司招聘实习生2人笔试历年参考题库附带答案详解.pdf
- 2025贵州黔晨综合发展有限公司招聘笔试综合排名及笔试历年参考题库附带答案详解.pdf
文档评论(0)