- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
样本及抽样分布
摘要: 概率论是研究随机现象的统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。
关键词: 概率论 数理统计中的常用分布 样本及抽样分布
随机样本和统计量 抽样分布定理
随机样本和统计量
1.1.总体、个体、随机样本
1.1.1总体与个体
在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。
例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究华北工学院男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。
但在数理统计里,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在实验中,抽取了若干个个体就观察到了的这样或那样的数值,因而这个数量指标是一个随机变量(或向量),而的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标可能取值的全体组成的集合等同起来。我们对总体的研究,就是对相应的随机变量的分布的研究,所谓总体的分布也就是数量指标的分布,因此,的分布函数和数字特征分别称为总体的分布函数和数字特征。
定义1:把研究对象的某项或几项数量指标的值的全体称为总体;
总体中的每个元素称为个体。
根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。
1.1.2.样本与样本空间
为了对总体的分布进行各种研究,就必需对总体进行抽样观察。
抽样——从总体中按照一定的规则抽出一部分个体的行动。
一般地,我们都是从总体中抽取一部分个体进行观察,然后根据观察所得数据来推断总体的性质。按照一定规则从总体中抽取的一组个体称为总体的一个样本,显然,样本为一随机向量。
为了能更多更好的得到总体的信息,需要进行多次重复、独立的抽样观察(一般进行次),若对抽样要求①代表性:每个个体被抽到的机会一样,保证了的分布相同,与总体一样。②独立性:相互独立。那么,符合“代表性”和“独立性”要求的样本称为简单随机样本。易知,对有限总体而言,有放回的随机样本为简单随机样本,无放回的抽样不能保证的独立性;但对无限总体而言,无放回随机抽样也得到简单随机样本,我们本书则主要研究简单随机样本。
对每一次观察都得到一组数据(),由于抽样是随机的,所以观察值()也是随机的。为此,给出如下定义:
定义2:设总体的分布函数为,若是具有同一分布函数的相互独立的随机变量,则称()为从总体(从分布函数)中得到的容量为的简单随机样本,简称样本。把它们的观察值()称为样本值。
定义3:把样本()的所有可能取值构成的集合称为样本空间,显然一个样本值()是样本空间的一个点。
1.1.3.样本的分布
设总体的分布函数为,密度函数为,()是的一个样本,则其分布函数(联合分布)、概率密度函数(联合概率密度函数)分别为:
=; =()
样本联合分布
1.2.分组数据统计表和频数直方图
通过观察或试验得到的样本值,一般是杂乱无章的,需要进行整理才能从总体上呈现其统计规律性. 分组数据统计表或频率直方图是两种常用整理方法.
1. 分组数据表:若样本值较多时,可将其分成若干组,分组的区间长度一般取成相等, 称区间的长度为组距. 分组的组数应与样本容量相适应. 分组太少,则难以反映出分布的特征,若分组太多,则由于样本取值的随机性而使分布显得杂乱. 因此,分组时,确定分组数(或组距)应以突出分布的特征并冲淡样本的随机波动性为原则. 区间所含的样本值个数陈为该区间的组频数. 组频数与总的样本容量之比称为组频率.
2. 频数直方图:频率直方图能直观地表示出频数的分布,其步骤如下:
设是样本的个观察值.
(i) 求出中的最小者和最大者;
(ii) 选取常数(略小于)和(略大于),并将区间等分成个小区间(一般取使在左右):
,
一般情况下,小区间不包括右端点.
(iii) 求出组频数,组频率,以及
原创力文档


文档评论(0)