第二篇习题答案.docxVIP

下载本文档

451
1
约5.28千字
约 10页
2020-06-06 发布于山东
举报
版权申诉

第二篇习题答案.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE6 / NUMPAGES9 第二篇概率与推断基础一、讨论题 1. 简述随机变量的均数与样本均数的区别。答：由随机实验中产生的结果用数值表示的变量叫随机变量。随机变量的均数是指随机变量所有可能值的平均，但它不是一般意义下的平均，而是要把每个取值都按照它的概率来加权之后的平均，每个可能取值的权重就是取这个值的概率。通常用而不是简单的来表示随机变量的均数，这样有利于我们理解描述的到底是哪一个随机变量。样本均数是指某样本所有观测值的平均值，是描述样本数据特征的一个统计量，通常用表示。对于一个特定总体而言，样本观测值会随抽取的样本不同而变化，相应的样本均数也会因样本的不同而变化。但是随机变量的均数是一个描述总体特征的参数，它是随机变量所有可能取值的平均值。 2. 简要回答二项分布、Poisson分布及正态分布的区别与联系。答：（1）三者的区别表4-1 三种分布的比较二项分布 Poisson分布正态分布概率函数概率函数意义说明n个观察数中恰好发生X个某事件的概率说明一定观察单位内发生某事件数为X的概率 X对应的曲线上的点代表概率密度，一个范围如X1－X2内的面积才代表概率决定参数 n ，π μ μ，σ 均数与方差关系一般（Z分布除外）适用条件互斥性，独立性，稳定性（用大量重复实验得到的样本率来估计参数π）同前，尚需n很大（趋向于无穷大），π很小连续分布，服从正态性类型离散型随机变量的概率分布离散型随机变量的概率分布连续型随机变量的概率分布可加性无有有（2）三者的联系 Poisson分布是二项分布的特殊情况，服从Poisson分布的资料也肯定服从二项分布。因此，能用Poisson分布法处理的资料原则上也能用二项分布来处理(但需知道总观察数和阳性数)，只不过此时计算较繁而已。反之则不然，服从二项分布者不一定都能用Poisson分布法来处理，需满足Poisson分布的近似条件才可。不论二项分布还是Poisson分布，只有满足正态近似条件时才可用正态近似法。当然此时也可用两种分布相应的方法，但正态近似法较为简便。 3. 指出下述陈述的错误并给出解释。（1）中心极限定理指出对于大样本而言，总体均数近似服从正态分布。答：此描述的错误主要在后半句“总体均数近似服从正态分布”，中心极限定理是针对样本均数而言的。中心极限定理是指从任意均数等于，方差等于的一个总体中抽取样本量为的简单随机样本。当样本量很大时，无论总体分布形态如何，样本均数的抽样分布近似正态分布。（2）对于大样本而言，观察值近似服从正态分布。答：当样本量很大时，无论总体分布形态如何，样本均数的抽样分布近似正态分布。即中心极限定理是针对样本均数而言。（3）从总体进行简单随机抽样，抽取的样本量越大，样本均数的标准差越大。答：，均数的标准差与样本量的平方根成反比，即抽取的样本量越大，样本均数的标准差越小。 4. 如何理解“样本率的抽样分布同样遵循中心极限定理”？答：二项分布可看成多次伯努利试验的和：用时表示结果第次实验“成功”，时表示第次实验结果“失败”，可以将各个相加得到总的“成功”次数（即），而“成功”率为，可将其看做一个均数，即样本量为的样本率可以用取值为0和1变量的样本均数来表示，因此其同样也遵循中心极限定理。 5. 使用置信区间的常见注意事项。答： = 1 \* GB3 ①公式不适用于所有抽样方法，不同的抽样方法需采用不同的均数估计公式； = 2 \* GB3 ②数据须来自相应总体的简单随机抽样，个体间相互独立是使用上述估计公式的前提； = 3 \* GB3 ③对于来自随意收集且偏倚较大的数据，没有恰当的方法进行统计推断，统计分析无法拯救糟糕的数据； = 4 \* GB3 ④在计算置信区间之前往往需先对数据进行探索性分析，例如找出异常值，检验数据是否服从正态分布； = 5 \* GB3 ⑤公式是事先假定总体标准差已知，实际研究中很可能无法得到总体标准差。当样本量较大时，可选用样本标准差s估计，对应置信区间可用公式近似估计； = 6 \* GB3 ⑥实际操作中的问题（如无应答与失访）会给抽样研究带来额外的误差，这些误差可能比随机抽样误差大得多，并且研究结果中这些误差并不能被误差范围所反映； = 7 \* GB3 ⑦统计推断的概率是指该方法重复进行的正确频率，即在100次抽样中，平均而言95%置信区间有95次包含了总体均数，但并不知道某一次结果的正确性。 6. 解释零假设与备择假设的含义。答：零假设又称无效假设，记为，是在我们没有证明某现象之前做出的保守推测，是被用来检验的假设，通常表述为“没有差异”，表示差异是由抽样误差引起的；备择假设又称对立假设，记为，表示其差异是因为比较的对象之间存在本质