- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用统计分析部分.doc
应用统计分析部分
第一章:抽样分布与设计
一、抽样分布
1、抽样的特点
抽样的目的是用被抽取部分个体所求得的数值推断总体的数量特征。其中,抽取部分个体称为总体的一个样本 。特别样本个数就是样本容量;样本取值就是样本观察值。
抽样是对所研究的总体,按照随机原则抽取部分个体进行的调查。
抽样的特点:随机原则:每个元素(或个体)有同等抽中的机会(具有代表性)
推断总体特征:样本的数值特征 推断 总体数量特征。
推断的精确性:把推断的误差控制在一定的精确度内(可靠性要求)
2、样本平均数的分布
正态总体分布:如果从正态分布总体N~(,)中随机抽取样本,则样本平均数的分布具有如下性质:
a: 样本的平均数的分布也是正态分布。
b: 样本的平均数的平均数等于总体的平均数
c: 当从无限总体抽样(或从有限总体采用放回抽样)时,样本平均数 分布的方差等于总体的方差除以样本容量。即
特别:当从有限总体不放回抽样时,样本平均数分布方差为:
();简记(1-)
总结:样本平均数服从正态分布:~N(,)
非正态总体分布:如果总体不服从正态分布时,样本平均数分布性质则由中心极限定理来解释如下:
a:只要数学期望和方差存在,从总体中随机相互独立抽取n个样本,则样本平均数是随机变量;
b:当n够大 (一般n30) 时,则~N(,)
c:特别总体服从二点分布p(x=i)=p,p(x=0)=1-p时,则期望p方差p(1-p) 故放回抽样时~,);不放回抽样时~,(1-))。
样本平均数之差的分布:
如果总体1:X~,抽n1个样本,
如果总体2:Y~,抽n2个样本,
则~
二、抽样设计
简单随机抽样: 事前编好随机数据表
总体(全部编号) 标签(混合) 用手随机模取 抽样
摇号机
类型抽样(分层抽样或分类抽样):
总体(按特征标志分组) 组1 随机抽样
…………………
组k 随机抽样
分配原则:等数;等比例;最优
设:总体为N(总体样本为n) ;分成k 组,第i组包含Ni个单位,样本为ni
等数:n1=n2=……..= nk=
等比例:;样本数
最优:标志变动程度为,,样本数
样本平均数i组:;
总体:
样本平均数总体方差:
全样本平均数的方差是各类型方差的加权综合
样本平均数i组方差:
是第i组内资料的方差,取各类型样本方差的加权数综合
整群抽样:
总体(按标志分成若干群) 随机抽取r个群 样本
总体分为R个群,每群含为M个单位。设为第i个群中的第j个单位的标志值。
i群平均数: i=1,2,…,r
总体平均数:
总体方差: 样本平均数的群间方差
其中,为总体各群的平均数;为总体的总平均数
样本方差: 样本的群间方差
其中,为抽样各群的样本平均数;为抽样各群全体样本的平均数
整群不放回抽样样本平均数的方差:
注:等距抽样;多阶段抽样;双相抽样;穿插抽样(略)。
第二章:参数估计与假设检验
一、参数估计问题
随机变量特征(概率分布;均值;方差) 如何? 解决方式:根据样本来估计所要的信息;具体思路:用样本统计量估计总体参数。
1、参数点估计量优劣的判别准则和常用的估计量
点估计:用样本统计量估计总体参数一个明确的估计值
准则:无偏性-----令为被估计参数;为的无偏估计量;则
一致性:样本容量越大,估计量的值越接近于被估计总体参数
有效性:,,如果的方差比的方差小,则比有效
常用估计量:
用样本的平均数估计总体平均数,即
用样本方差和标准差s估计总体方差和标准差即;
用样本中具有某特征单位的比例估计总体比率p,即
2、参数区间估计问题
区间估计:用样本估计总体参数可能取值的区间(给出了点估计可靠性的一种描述,是点估计的补充)
选择两个统计量1和2 估计 P(1<<=1-(事先给定的正数)
,且12,[1,2] 称为置信水平为1-的置信区间;1-置信概率(置信水平或置信系数);实有意义:有100(1-)%把握断定在[1,2]内。
总体平均数的区间估计
假设:总体服从正态分布N() ; 随机变量X的概率密度函数:
f(x)= ;记作:x~N()
如果令:Z=(统计量)
则E(Z)=E()==0
D(Z)==E=E()
=E(=1
所以:Z~N(0,1)标准正态分布 密度函数 f(x)=
分布函数Φ(x)=
Φ(
文档评论(0)