- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[统计学讲义最新稿
第二章 统计量及其分布
在概率论的学习中,我们已经知道,随机变量及其概率分布全面描述了随机现象的统计规律性,但在实际问题的研究中概率分布往往是未知的。本章我们要讨论统计量的分布,找到总体参数与统计量的分布之间的联系,进而通过样本去推断总体的数字特征。
第一节 总体与样本
一、总体
统计学把所要研究的事物或现象的全体称为总体,而把构成总体的每个元素(成员)称为个体。要研究10,000名在校大学生,10,000名大学生就构成总体,每位大学生就是个体。实际问题的研究中,我们关心的往往不是大学生(个体)的一切方面,而是它的某个数量标志,比如大学生的身高,这时所有的身高就构成总体,总体表现为一个数据集,其中有的数值大有的数值小,有的出现机会多,有的出现机会少,记身高为X,它是一个随机变量,记其分布函数为F(x) 。可以把X的所有可能取值看做总体,并称这一总体为具有分布函数F(x)的总体。
总体也可以是多维的,如研究大学生的身高对体重的影响,身高和体重这两个数量标志就构成二维随机变量(X1,X2),其取值的全体就构成总体,即二维总体,记二维随机变量(X1,X2)的联合分布函数为F(x1, x2),称这一总体为具有分布函数F(x1, x2)的总体。
二、样本
统计学对总体的研究是以样本为工具的。为了掌握总体的分布规律,从总体中随机抽取n个个体,其标志值(比如身高数值)记为(x1,x2,…,xn),则(x1,x2,…,xn)称为总体的一个样本,样本包含的个体的数目n称为样本容量。
由于样本是从总体中随机抽取的,抽取前无法预知它的数值,每个Xi(1,2,…n)都是一个随机变量,样本(X1,X2,…,Xn)则是一个n维随机变量。样本在抽取后就有确定的观测值,表现为n个具体的数据(x1,x2,…,xn).
三、 简单随机样本
抽取样本是手段,推断总体才是目的。为使样本更好的反映总体的信息,对样本抽取有两个基本要求。一是样本具有随机性,总体中每个个体都有同等可能性进入样本,即每个Xi与总体X具有相同的分布F(x).二是样本满足独立性,即X1,X2,…,Xn相互独立,每一Xi的取值不影响另一Xi的取值。
如果从总体中抽取样本(),其每个分量()都与总体具有相同的概率分布,且相互独立,则这样的抽样方法称为简单随机抽样,而如此得到的样本,称为简单随机样本。如果总体具有分布函数或概率密度,显然来自总体的简单随机样本()具有联合概率分布.
四、总体分布函数与样本分布函数
样本是总体的代表,简单随机样本能较好的代表总体,其代表性到底如何呢?
设x1,x2,…,xn是取自分布函数为F(x)的总体的样本,表示随机事件在这次重复独立观测中出现的次数,即个观测值中小于等于的个数。若重复进行次抽样,对于同一个,可能取不同数值,实际上是一个统计量,从而是随机变量。将样本观测值按升序排列,记为x(1),x(2),…,x(n),定义如下函数
则Fn(x)是一单调非减、右连续函数,且满足有界性,即
Fn(-)=0 Fn(+)=1
由此可见,Fn(x)是一个分布函数,称为样本分布函数(经验分布函数).
对于每一固定的x,Fn(x)是事件{X x}发生的频率,当n固定时,不同的样本观测值x1,x2,…,xn将有不同的Fn(x),Fn(x)是一随机变量。
例1.某食品厂用自动罐装机罐装牛肉罐头,由于随机性,每个罐头的重量都有差别。现从生产线上随机抽取10罐,重量数据如下:
344, 336, 345, 342, 340, 338, 344, 343, 344, 343
容易得到样本分布函数
格里纹科定理:设x1,x2,…,xn是取自总体分布函数(理论分布函数)为F(x)的样本,Fn(x)是样本分布函数,有
定理表明,当n充分大时,样本分布函数是总体分布函数的一个良好的近似,这就是为什么我们用样本推断总体的理由。
第二节 几种重要的概率分布
一、正态分布
若随机变量X的密度函数为
,
则称X服从正态分布,记为.参数,.
正态分布的分布函数为
F()=
中心极限定理表明,大量均匀微小且相互独立的因素综合作用的结果,其变量可用正态分布近似。自然现象、社会经济现象中很多变量可作为正态分布处理。正态分布具有如下性质:
(1) 所有的正态分布构成一个分布族,每一特定的正态分布通过其均值和标准差来区分。
(2) 正态分布的概率密度曲线在均值处达到最大。
(3) 正态分布的均值可以是任意数值:负数、零或正数。均值决定正态分布的位置。
(4) 正态分布是对称分布,以为对称轴,均值左边的
您可能关注的文档
最近下载
- 2023年人教版七年级数学(下册)期末试卷及答案.doc VIP
- 2025年北京海淀区中考一模数学试卷及答案详解(精校打印).pdf VIP
- 小学语文阅读理解答题技巧.ppt VIP
- 机械检查工职业技能考试题库及答案.pdf VIP
- 《可编程控制器应用》判断题测验.docx VIP
- 武汉市2025届高中毕业生四月调研考试(四调)数学试卷(含答案详解).pdf
- 标准图集-20S515-钢筋混凝土及砖砌排水检查井.pdf VIP
- Linux操作系统应用(麒麟系统)PPT完整全套教学课件.pptx VIP
- NB-T20643-2023核电厂设备管理分级技术导则.pdf VIP
- 大学通用俄语(2)(北航)大学MOOC慕课 客观题答案.pdf VIP
文档评论(0)