网站大量收购独家精品文档,联系QQ:2885784924

样本与统计量数据的简单处理.pptVIP

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * 前言 数理统计是应用广泛的一个数学分支, 它以概率论为理论基础,研究如何合理地获 得数据资料,建立有效的数学方法,根据所 获得的数据资料,来研究随机现象的规律性, 对研究对象的性质作出合理的估计和判断。 在这个课程里,我们学习数理统计学的 初步,主要讲述估计与检验等原理,线性回 归与方差分析等统计方法。 总体与样本 总体(母体)—— 研究对象的全体。 个体—— 总体中的每一个元素。 欲研究或推断总体 X 的性质,似乎应对每一个个体逐 一测定,但这样的做法很多时候是不必要或是不可行的。 比如考察广州人的身高、体重,某种导弹的爆炸威力,某 电子元件的寿命等。我们只能在总体中随机抽取部分个体 出来测定。这就是——抽样。 在数理统计学中,我们是对总体的一个或若干个数量 指标进行研究,这样,对总体的研究就归结为对随机变量 的研究。以后说到总体时,指的就是它对应的某个或某些 随机变量。 总体与样本 样本(子样)—— 从总体中随机抽取出来的部分个体作成的集合。记为: 样本中所含的个体的数目。 样本(子样)容量—— 注意到这里每个 Xi 因随机抽取而随机取值,所以也是 随机变量。抽样完成后得到的确切结果: 是 维随机变量 的一个观 察值。称为样本值或子样观察值。 总体与样本 为保证抽取出来的样本能够反映出总体的性质,要求 样本具有代表性,即每个 Xi 与 X 同分布;还要求具有独 立性,即 是相互独立的。满足以上条件 的样本(子样)称作简单随机样本(子样)。 要获得简单随机样本(子样),对有限总体, 应作有放回的随机抽样,对无限总体或总体相当大 时,也可作无放回的随机抽样。 统计量 当我们不能完全掌握某一总体的分布函数时,只要掌握 了总体的某些数字特征(总体参数),就可基本上确定该总 体的分布,当总体参数也未知时,就只能依据样本对未知数 进行推断。通常我们利用样本构造出某种函数作为推断的基 础。这就是所谓的统计量。 统计量—— 样本 对应的不含未知参数的实值函数, 记作: 它本身也是一随机变量。它的分布 称作抽样分布。 设 是随机变量 X 的一个样本。 样本均值—— 通常作为总体 X 的均值的一个估计值。 样本方差—— 通常作为总体 X 的方差的一个估计值。 样本标准差(均方差)—— 通常作为总体 X 的标准差(均方差)的一个估计值。 常用统计量 估计量的 无偏性 数据的简单处理 数据整理(分组)—— (1)根据样本容量 n 确定分组数 k 当 时, 当 时, 当 时, (2)计算组距(一般采用等距分组,也可据实际情况分组) 组距等于比极差(原始数据中的最大值M与最小值m 之差)除以组数 k 略大的测量单位的整数倍。 如: 则取组距为 5。 当 时, 一般地, 数据整理(分组)—— (3)确定组限和组中点值 一般地,组的上限与下限应比数据多一位小数。这样可 保证每组所含的原绐数据不重叠。(可据实际问题另作要求) 设现有 50 个原始数据(均是整数),决定分作 8 个小组, 数据中的最大值是 100,最小值是 65 , 则组距 组距 组数 取 得分组如下: 组中点值分别为: 一般遵循“上限不在内”的原则 (解决实际问题时,也有出现开口组的情形) 数据的简单处理 数据整理(分组)—— (4)计算各组频数和频率,作频数和频率分布表 频数 指落在第 组的数据个数,频率为频数与总数据量 之比: (5)作频率直方图 要把每一小组的频率用一小矩形的面积去表示,方法是: 以样本值为横坐标,频率/组距为纵坐标,以分组区间为 底,以频率/组距为高作一系列矩形。 频率直方图示意图: 要把每一小组的频率用一小矩形的面积去表示,方法是: 以样本值为横坐标,频率/组距为纵坐标,以分组区间为 底,以

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档