1. 统计数据的收集与整理.pptVIP

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1. 统计数据的收集与整理.ppt

统计数据的收集与整理 总体与样本 数据类型及频数(率)分布 样本的几种特征数 总体与样本 总体:研究的全部对象,构成总体的基本单位称为个体。 总体按总体单位的数目多少可分为: 有限总体:含有有限个个体的总体。 无限总体:包含有无限多个个体的总体。 样本:从总体中抽出的若干个个体所构成的集合。 抽样 从总体中获得样本的过程 放回式抽样 非放回式抽样 数据类型及频数(率)分布 连续型数据 如长度、时间、血压、重量 离散型数据 动物的头数 频数表和频数图(离散型数据) 例1.1 调查每天出生的10名新生儿中,体重超过3千克的人数,共调查120天。 频数表和频数图(连续型数据) 某农场“三尺三”高梁株高调查结果 表1-3 高粱“三尺三”株高频数(率)表 高粱“三尺三”株高柱形图 根据频数表(图)可以看出数据分 布的以下三个重要特征: 1、数据分布的集中情况 2、数据分布的变异情况 3、数据分布图的形状 样本的几个特征数 平均数 标准差 变异系数 偏斜度和峭度 平均数 算术平均数:一个数量资料中各个观察值的总和除以观察值的个数所得的商,记为 中值(数):将资料内所有观察值从大到小排列,居中间位置的观察值称为中数,记为Md 例如: 1、2、3、4、5, 中数是:3 1、2、3、4、5、6 中数是: (3+4)/2=3.5 众数:资料中最常见的一数,或次数最多一组的中点值,称为众数,记为Mo。 例如:在资料23、24、23、22、23、25、20、23、中         Mo=23 几何平均数:n个观察值,其乘积开n次方,即为几何平均数,用G代表。 算术平均数 设某一资料包含n个观测值: y1、y2、…、yn, 则样本平均数可通过下式计算: (1.1) 其中,Σ为总和符号; 表示从第一个观测值y1累加到第n个观测值yn。可简写为Σy,(1.1)式可改写为: 离散型频数资料的平均值 例1.1 调查每天出生的10名新生儿中,体重超过3千克的人数,共调查120天。 根据表1-1,列出下表 连续型频数资料的平均值 标准差 用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。 仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。 样本方差(S2): 标准差(s): 偏斜度和峭度 偏斜度(g1) 当g1=0时,数据分布呈正态; 当g1为正数时,分布为正偏; 当g1为负数时,分布为负偏; 一般 当|g1| =2时,曲线偏斜很严重 。 峭度(g2) 当g2=0时,数据分布呈正态; 当g2 为正数时,曲线过于陡峭 当g2 为负数时,曲线过于平坦 提示:正态分布的偏斜度和峭度均为0。 变异系数(CV) 变异系数是衡量资料中各观测值变异程度的另一个统计量 。 变异系数可以消除单位 和 (或)平 均数不同对两个或多个资料变异程度比较的影响。 变异系数(CV) 两个小麦品种株高变异的比较 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 课内习题 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 g2的大小说明曲线的陡峭程度 9.5 9.02 95.0 甲 11.3 8.50 75.0 乙 变异系数 CV(%) S(cm) 平均数(cm) 品种 * * y = 组值,f = 频数,N = 总频数,k = 组数,fy = f和y相乘 y fy m = 组中值,f = 频数,N = 总频数,k = 组数,fm= f和m相乘 (1.10) (1.12) y y2 y y2 三阶中心矩 二阶中心矩 g1是一个不带单位的纯数

文档评论(0)

caijie1982 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档