- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概率论与数理统计简明讲义 数理统计基础
第五章 数理统计基础知识
统计方法可分为统计描述与统计推断。统计描述历史悠久,主要是用少量关键参数刻划
总体分布特征。而统计推断发展于上个世纪,相对年轻;它利用观测数据来支持统计假设。
下面简要介绍两者的基本概念。
一、 总体与样本
在问题2.13 中,我们学会了可用一个连续型随机变量X 及其密度函数 去描述2005
p (x )
年全国新生婴儿的体重。如果完全知道密度函数 ,就可以计算一个婴儿的体
p (x )
重在某个范围的概率以及全国新生婴儿的平均体重和体重的标准差等数字特征,从而更清楚
的了解全国新生婴儿的整体状况。但问题是如何求得体重X 的密度 呢?
p (x )
一般地,在概率论中,随机变量X 的分布通常是假定已知的,概率问题大都是由已知
的分布去求概率或数字特征等。但实际中怎样才能知道随机变量X 的分布呢?
推断描述随机现象的随机变量的分布,正是数理统计要解决的首要问题。为此,我们从
所要研究的对象全体中抽取部分进行观测(即抽样调查)以取得信息,进而对整体作出推断。
比如,为了掌握2005 年全国新生婴儿的体重的分布,必须先对新生婴儿的体
重进行抽样调查。虽然理论上可以进行全面调查,但是实际困难重重,既会耗费大量的人力、
物力、财力,也往往由于工作量过大、时间过长等原因影响数据的质量。一项经过科学设计
并严格实施的抽样调查结果可能比全面调查更可靠。另一方面,在许多情况下,全面调查根
本不可为。例如,对电视机的寿命进行观测,由于是破坏性试验而只能采取抽样调查。
在数理统计学中把研究对象的全体称为总体,而把组成总体的各个单元称为个体。实际
问题关心的往往是总体某方面的数量特征,它是一个随机变量。所以统计学认为,总体就是
一个随机变量X ,它的分布 称为总体分布。数理统计的基本问题就是推断总体的分布。
F (x )
从总体X 中抽取部分个体,称为抽样,即是对X 进行若干次观测,得到的就是 n 个随
X机变量,X , L ,称为样本,其中n 为样本容量,样本中的个体称为样品。
1 n
为使样本具有充分的代表性,常进行简单随机抽样,即要求:
(1) 样本有随机性:总体中每个个体入选的机会相等,即每个样品X i 与总体X 同分布;
X ,X , L
(2 ) 样本有独立性:每次抽样的结果不影响其它各次抽样的结果,即 1 n 相互独立。
简单随机抽样得到的样本称为简单随机样本。从总体中进行有放回抽样,显然是简单随
机抽样,得到简单随机样本。从有限总体中进行不放回抽样,虽然不是简单随机抽样,但当
总体容量N 很大而样本容量 n 较小( n 10≤% ) 时,可近似看作有放回抽样,从而得到近似的
N
简单随机样本。除特别声明,以后提到的抽样与样本,均是指简单随机抽样与简单随机样本。
日常生活中也常用抽样调查。要评估一锅汤的味道,没必要把一锅汤喝完;只需将汤搅
拌均匀,从中品尝一勺就好。这个例子揭示了抽样方法最重要的信息:
第一,“把汤搅拌均匀”说明抽样的随机性。没有随机性,样本就不能很好地反映总体
的情况;把刚加盐的地方舀的汤作为样本,就会推出汤太咸的错误结论;
第二,“品尝一勺”意味样本容量不能太小,也不必太大;少无以知味,多只是浪费;
文档评论(0)