统计学第3章数据分布特征描述.pptVIP

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学第3章数据分布特征描述

第三章 数据分布特征描述 第一节 统计变量集中趋势测定★ 第二节 统计变量离散程度测定★ 第三节 变量分布的偏度与峰度 第四节 Excel计算描述统计指标 略 学习要求: 理解测度统计数据集中趋势、离散程度的概念、指标、相互关系; 掌握主要分析指标的计算方法和应用场合,并能熟练进行相关计算分析。 集中趋势指标有两类: 数值平均数 根据全部数据计算得到的代表值。 优点:数学性质良好,可用于统计推断 缺点:易受极端值影响。 主要有算术平均数、调和平均数及几何平均数,三者均为幂平均数特例。 位置平均数 根据对总体中处于特定位置的单个或部分单位标志值直接观察或推算确定的代表值。 优点:不易受极端值影响,具有较好稳健性。 缺点:不宜用作统计推断。 主要包括众数和中位数。 3.分析现象之间的依存关系。 如研究劳动者文化程度与收入的关系。 4.(数值)平均指标是推断统计中的重要统计量,是进行统计推断的基础。 几种常见的位置特征数 数据分布的位置特征数实际上也是数据的代表值,代表了数据的一般水平。 在不同场合,可以适当选用平均数、中位数、众数充当位置特征数(代表值) 其中平均数不同于中位数、众数的特点在于: 平均数是由所研究的全体数据参加计算所得。 平均数的一般形式叫做幂平均数。常见的有算术平均数、几何平均数、调和平均数。 权数w均相等时,加权平均数退化为简单平均数: 特例情况 k 1:算术平均数 加权 简单 k -1:调和平均数 加权 简单 k?0:几何平均数 加权 简单 权数作用: 即使不改变被平均的数值,仅改变权数结构,即可改变平均数水平。 例如,改变教师职称结构,而不改变各种职称教师课时费标准,会改变平均课时费水平。 权数实质 权数的实质在于其结构,即结构比例形式(比重权数)。 其更能清晰表明权数之权衡轻重的作用。 1.简单算术平均数 对未分组数据,采用简单算术平均数公式。即把各项数据直接加总,然后除以总项数。 计算公式: 平均数的应用场合 常见的应用场合有: 作为统计指标的一种表现形式 作为统计总体分布的位置特征数 反映一个统计变量所有观察值的一般水平 抵消掉随机试验中的偶然因素影响,显示出试验的规律性水平。 数据是随机试验的结果。 随机试验的个别结果会呈现出或高或低的起伏波动,实际上这是由偶然因素影响造成的。 在进行大量重复试验,将试验结果简单算术平均,那么随着试验次数的增加,算术平均值就会越来越逼近一个稳定值,而这个稳定值就是试验的规律性水平(数学期望值)。 因此,在统计分析中,常常采用算术平均的手法去抵消现象中的偶然影响,以期近似地认识现象的规律性水平。 对分布数列求众数,具有条件性。 存在性: 若分布数列没有明显集中趋势,则不存在众数; 唯一性: 若分布数列有多个相对集中趋势,则有多个众数。 从分布曲线上看,众数就是一个变量分布曲线的最高峰所对应的变量值。(见课本55页图3-1) 为确定众数,通常要编制分布数列。 众数是分布曲线最高点对应的标志值。 单项式分布数列中,众数是具有最多次数的标志值,可观察得到。如表3-2中,众数值Mo=25, 组距式分布数列中,众数需要推算。 未分组数据计算中位数 若数据项数是奇数,则位于中间的数值为中位数;如5人收入为: 1200,1450,1500,1600,2000元,则其收入中位数 Me 1500。 若数据项数是偶数,则取居中两个数值的平均数为中位数。如6人收入为: 1200,1450,1500,1600, 1800,2000元,则收入中位数 Me 1550。 下限公式 上限公式 3.算术平均数只能用于定量(数值型)数据; 中位数适用于定序数据和定量数据; 众数适用于所有形式(各种类型及计量层次)的数据。 4.算术平均数受数据极端值影响,而众数和中位数都不受极端值的影响。 为排除极端值干扰,可计算切尾均值,即去掉数据中最大和最小的若干数值后计算的均值。 该思路常用于某些比赛计分规则中,如体操、跳水等。 切尾均值是将算术平均数与中位数互相结合的结果。 第二节 统计变量离散程度测定 一、离散程度指标及其作用 二、极差、四分位差和平均差 三、方差和标准差 四、离散系数 五、异众比率 例:观察7个人的体重和身高如下: 体重(公斤)xi: 62, 67, 65, 69, 70, 73, 74 身高(厘米)yi: 165, 166, 168, 170, 174, 178, 180 判断体重与身高哪个离散较为严重。 注: 两组计量单位不同,不能用极差、平均差、标准差等绝对离散特征数直接进行比较。适合采用离散系数比较。 第三节 变量分布的偏度与峰度 一、矩(

文档评论(0)

tiangou + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档