[统计学讲义最新稿.docVIP

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[统计学讲义最新稿

第二章 统计量及其分布 在概率论的学习中,我们已经知道,随机变量及其概率分布全面描述了随机现象的统计规律性,但在实际问题的研究中概率分布往往是未知的。本章我们要讨论统计量的分布,找到总体参数与统计量的分布之间的联系,进而通过样本去推断总体的数字特征。 第一节 总体与样本 一、总体 统计学把所要研究的事物或现象的全体称为总体,而把构成总体的每个元素(成员)称为个体。要研究10,000名在校大学生,10,000名大学生就构成总体,每位大学生就是个体。实际问题的研究中,我们关心的往往不是大学生(个体)的一切方面,而是它的某个数量标志,比如大学生的身高,这时所有的身高就构成总体,总体表现为一个数据集,其中有的数值大有的数值小,有的出现机会多,有的出现机会少,记身高为X,它是一个随机变量,记其分布函数为F(x) 。可以把X的所有可能取值看做总体,并称这一总体为具有分布函数F(x)的总体。 总体也可以是多维的,如研究大学生的身高对体重的影响,身高和体重这两个数量标志就构成二维随机变量(X1,X2),其取值的全体就构成总体,即二维总体,记二维随机变量(X1,X2)的联合分布函数为F(x1, x2),称这一总体为具有分布函数F(x1, x2)的总体。 二、样本 统计学对总体的研究是以样本为工具的。为了掌握总体的分布规律,从总体中随机抽取n个个体,其标志值(比如身高数值)记为(x1,x2,…,xn),则(x1,x2,…,xn)称为总体的一个样本,样本包含的个体的数目n称为样本容量。 由于样本是从总体中随机抽取的,抽取前无法预知它的数值,每个Xi(1,2,…n)都是一个随机变量,样本(X1,X2,…,Xn)则是一个n维随机变量。样本在抽取后就有确定的观测值,表现为n个具体的数据(x1,x2,…,xn). 三、 简单随机样本 抽取样本是手段,推断总体才是目的。为使样本更好的反映总体的信息,对样本抽取有两个基本要求。一是样本具有随机性,总体中每个个体都有同等可能性进入样本,即每个Xi与总体X具有相同的分布F(x).二是样本满足独立性,即X1,X2,…,Xn相互独立,每一Xi的取值不影响另一Xi的取值。 如果从总体中抽取样本(),其每个分量()都与总体具有相同的概率分布,且相互独立,则这样的抽样方法称为简单随机抽样,而如此得到的样本,称为简单随机样本。如果总体具有分布函数或概率密度,显然来自总体的简单随机样本()具有联合概率分布. 四、总体分布函数与样本分布函数 样本是总体的代表,简单随机样本能较好的代表总体,其代表性到底如何呢? 设x1,x2,…,xn是取自分布函数为F(x)的总体的样本,表示随机事件在这次重复独立观测中出现的次数,即个观测值中小于等于的个数。若重复进行次抽样,对于同一个,可能取不同数值,实际上是一个统计量,从而是随机变量。将样本观测值按升序排列,记为x(1),x(2),…,x(n),定义如下函数 则Fn(x)是一单调非减、右连续函数,且满足有界性,即 Fn(-)=0 Fn(+)=1 由此可见,Fn(x)是一个分布函数,称为样本分布函数(经验分布函数). 对于每一固定的x,Fn(x)是事件{X x}发生的频率,当n固定时,不同的样本观测值x1,x2,…,xn将有不同的Fn(x),Fn(x)是一随机变量。 例1.某食品厂用自动罐装机罐装牛肉罐头,由于随机性,每个罐头的重量都有差别。现从生产线上随机抽取10罐,重量数据如下: 344, 336, 345, 342, 340, 338, 344, 343, 344, 343 容易得到样本分布函数 格里纹科定理:设x1,x2,…,xn是取自总体分布函数(理论分布函数)为F(x)的样本,Fn(x)是样本分布函数,有 定理表明,当n充分大时,样本分布函数是总体分布函数的一个良好的近似,这就是为什么我们用样本推断总体的理由。 第二节 几种重要的概率分布 一、正态分布 若随机变量X的密度函数为 , 则称X服从正态分布,记为.参数,. 正态分布的分布函数为 F()= 中心极限定理表明,大量均匀微小且相互独立的因素综合作用的结果,其变量可用正态分布近似。自然现象、社会经济现象中很多变量可作为正态分布处理。正态分布具有如下性质: (1) 所有的正态分布构成一个分布族,每一特定的正态分布通过其均值和标准差来区分。 (2) 正态分布的概率密度曲线在均值处达到最大。 (3) 正态分布的均值可以是任意数值:负数、零或正数。均值决定正态分布的位置。 (4) 正态分布是对称分布,以为对称轴,均值左边的

文档评论(0)

1789811832 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档