- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章数理统计的基本概念
绪言
数理统计包括两大内容:
一、试验的设计和研究研究更合理、更有效、更精确地获
取观察资料的方法。
二、统计推断研究如何利用一定的资料对所关心的问题
作出尽可能精确、可靠的结论。
例 为了解南京市民2002年收入情况,现抽样调查10000人的
收入。
问题:
1. 怎样从10000人的收入情况去估计全体南京市民的平均收
入?怎样估计所有南京市民的收入与平均收入的偏离程度?
2. 若市政府提出了全体南京市民平均收入应达到的标准,从抽
查得到的10000人收入数据,如何判断全体南京市民的平均收入
与收入标准有无差异?差异是否显著?
3. 抽查得到的10000人的收入有多有少,若这10000人来自不同的
行业,那么,收入的差异是由于行业不同引起的,还是仅由随机
因素造成的?
4. 假设收入与年龄有关,从抽查得到的10000人收入和年龄的
对应数据,如何表述全体南京市民的收入与年龄之间的关系?
问题1实质:从10000人的收入出发,估计全体南京市民收入
分布的某些数字特征(此处是期望和方差) 。
在数理统计中,解决这类问题的方法称为参数估计。
问题2实质:根据抽查得到的数据,去检验总体收入的某个
数字特征(此处是期望)与给定值的差异。
在数理统计中,解决这类问题的方法称为假设检验。
问题3实质:分析数据误差的原因(此处是行业) 。当有多个因
素起作用时,还要分析哪些因素起主要作用。
在数理统计中,解决这类问题的方法称为方差分析。
问题4实质:根据观察数据研究变量间(此处是收入与年龄间)
的关系。
在数理统计中,解决这类问题的方法称为回归分析。
第一节随机样本
一、总体
在数理统计中,将所研究的对象的某项指标值的全体称为
总体(或母体) ,而将构成总体的每个单位称为一个个体。
当总体中包含的个体总数是有限的,就称总体为有限总体,
否则称总体为无限总体。
设待研究的指标为X ,由于X 的取值是对随机抽取的个体观
察得到的,因而可将X视为随机变量,并设其分布函数为
F(x) 。
定义6.1 一个随机变量X(或其分布函数F(x)) 叫做一个总体,X
的每个可能值叫做一个个体。
二、样本
从总体X 中,随机地抽取n个个体进行观察,可得到n个观
察值,将其依抽取的顺序记为(x ,x , ,x )。
1 2 n
若将总体在进行第 i 次抽样时对应的随机变量记为 X ,
i
则xi 就是 X i 的观察值。
我们提出以下要求:
1. X i 与X 同分布; 抽样方式为重复抽样
2. X ,X , ,X 相互独
1 2 n
立。
实际应用中,一般当有限总体中包含个体数目N10n 时,即
使采用不重复抽样,也认为要求满足。
定义6.2 若X ,i 1,2, n 相互独立,且均与总体X有相同分
i
布,则称随机向量( X ,X , ,X )为总体X 的一个容量为n 的
1 2 n
简单随机样本(简称样本) ,称n 为样本容量。
设 X 的观察值为 x i ,称( x ,x , ,x )为X 的一个样本
i 1 2 n
观察值(样本点) ,称={( x ,x , ,xn )}为样本空间。
1 2
说明:1. 是样本观察值全体所成集合,是 n 维空间上的点
集,它不是总体X 的样本空间。
2. 在一次抽样之前,我
文档评论(0)