- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章统计量及其分布.doc
第五章 统计量及其分布
§5.1 总体与样本
5.1.1 总体与个体
总体:研究对象的全体。包括有限总体和无限总体,本书将以无限总体作为主要研究对象。
个体:构成总体的每个成员。
可以视总体为一个分布。因此“从总体中抽样”与“从某分布中抽样”意思相同。
举例。
5.1.2 样本
从总体中随机地抽取n个个体,记其指标值为,则称为总体的一个样本,n称为样本容量。举例。
简单随机样本(简称样本)的特点:
(1)随机性(2)独立性。
设总体X具有分布函数,为取自该总体的容量为n的样本,则样本联合分布函数为
注意:对于无限总体,随机性与独立性容易实现,困难在于排除有意或无意的人为干扰。对有限总体,只要总体所含个体数很大,特别是与样本量相比很大,则独立性也可基本得到满足。
举例。
§5.2 样本数据的整理与显示
5.2.1 经验分布函数
定义:设是取自总体分布函数为的样本,若将样本观测值由小到大进行排列人,为,则称为有序样本,用有序样本定义如下函数
则是一非减右连续函数,且满足
和。
由此可见,是一分布函数,并称其为经验分布函数。
举例。
定理5.2.1(格里纹科定理) 设是取自总体分布函数为的样本,是其经验分布函数,当时,有
注意:该定理表明当相当大时,经验分布函数是总体分布函数的一个良好的近似。
5.2.2 频数频率分布表
例1 为研究某厂工人生产某种产品的能力,我们随机调查了20位工人某天生产的该种产品的数量,数据如下
160 196 164 148 170
175 178 166 181 162
161 168 166 162 172
156 170 157 162 154
对这20个数据(样本)进行整理,具体步骤如下:
(1)对样本进行分组 首先确定组数,作为般性的原则,组数通常在5-20个,对容量较小的样本,通常将其分为5组或6组,容量为100左右的样本可分7-10组,容量为200左右的样本可分9-13组,容量为300左右及以上的样本可分12-20组,目的是使用足够的组来表示数据的变异。这里将数据分为5组,即。
(2)确定每組组距 每组区间长度可以相同也可以不同,实用中常选用长度相同的区间以便于进行比较,此时各组区间的长度称为组距,其近似公式为:
组距=(样本最大观测值-样本最小观测值)/组数
本例中,数据最大观测值为196,最小观测值为148,故组距近似为
方便起见,取组距为10。
(3)确定每组组限 各组区间端点为
,
形成如下的分组区间
,
其中略小于最小观测值,略大于最大观测值,配合我中可取,,于是本例的分组区间:
,,,,,
通常可用每组的组中值来代表该组的变量取值,组中值=(组上限+组下限)/2。
(4)统计样本数据落入每个区间的个数-频数,并列出其频数频率分布表。本例的频数频率分布表见下表。从表中可以读出很多信息,如:40%的工人产量在157到167之间;产量少于167个的有12人,占60%;产量高于177的有3人,占15%。
例1的频数频率分布表
组序 分组区间 组中值 频数 频率 累计频率/% 1 152 4 0.20 20
2 162 8 0.40 60
3 172 5 0.25 85
4 182 2 0.10 95
5 192 1 0.05 100
合计 20 1 5.2.3 样本数据的图形显示
一、直方图
它在组距相等场合常用宽度相等的长条矩形表示,矩形的高低表示频数的大小。在图形上,横坐标表示所关心变量的取值区间,纵坐标表示频数,这样就得到频数直方图,如图。把纵轴改成频率就得到频率直方图。为使各长条矩形面积和为1,可将纵轴取为频率/组距,称为单位频率直方图或简称频率直方图。
二、茎叶图
例2 某公司对就聘人员进行能力测试,测试成绩总分为150分。下面是50痊应聘人员的测试成绩(已经过排序):
64 67 70 72 74 76 76 79 80 81
82 82 83 85 86 88 91 91 92 93
93 93
文档评论(0)