统计学复习重点 甘科夫.docVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学复习重点 甘科夫.doc

统计学复习重点 1.简要说明抽样误差和非抽样误差 非抽样误差是由于调查过程中各有关环节工作失误造成的,他包括调查方案中有关规定或解释不清所导致的填报错误,抄录错误,汇总错误及不完全抽样框导致的误差,调查中由于被调查者不回答产生的误差,理论上是可以避免的 抽样误差是利用样本推断总体时产生的误差,可被控制不可避免 2.说明基尼系数的含义及用处 根据洛伦茨曲线给出的衡量收入分配平均程度的指标,即是基尼系数 基尼系数=A/A+B,A表示实际收入L曲线和绝对平均线之间的面积,B表示实际收入L曲线和绝对不平均线之间的面积, 作用:反映收入分配的变化程度,衡量收入分配平均程度 3,一组数据的分布特征可以从哪几个方面进行测度 分布集中趋势的测度 分布离散程度的测度 分布偏态与峰度的测度 4简述众数,中位数和均值的特点和运用场合 众数: (1)一组数据中出现次数最多的变量值 (2)分布最高峰点所对应的数值即众数 (3)一种位置代表值,不受极端值的影响,应用场合有限, (4)一组数据可能没有众数或有几个众数 (5)主要用于分类数据,也可用于顺序数据和数值型数据 中位数: (1)排序后处于中间位置上的数据 (2)不受极端值的影响,具有稳健(稳定)性特点 (3)主要用于顺序数据,也可用数值型数据,但不能用于分类数据 均值: (1)集中趋势的最常用、最重要的测度值 (2)分子分母必须属于同一总体 (3)易受极端值的影响 (4)有简单平均数和加权平均数之分 5解释总体分布,样本分布和抽样分布的含义 总体分布: 1.总体中各元素的观察值所形成的分布 2.分布通常是未知的 3.可以假定它服从某种分布 样本分布: 1.一个样本中各观察值的分布 2.也称经验分布 3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 抽样分布: 1.样本统计量的概率分布,是一种理论分布 2.在重复选取容量为n的样本时,由该统计量的所有可能取值及出现的概率分布 样本统计量(样本均值, 样本比例,样本方差等)是随机变量,它有若干可能取值,每个可能取值都有一定的可能性(即概率),从而形成它的概率分布,即统计上所谓的抽样分布。 3.样本统计量是由n个随机变量构成的函数,故抽样分布属于随机变量函数的分布。 4.结果来自容量相同的所有可能样本 6.简述评价估计量好坏的标准 无偏性:估计量抽样分布的数学期望等于被估计量的总体参数 有效性:对于同一总体参量的两个无偏点估计量,有更小标准差的估计量更有效 一致性:随样本量的增大,点估计量的值越来越接近总体的参量 7说明区间估计的基本含义 在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 8解释置信水平为95%的置信区间 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平。由样本统计量所构造的总体参数的估计区间称为置信区间 95%的样本均值会落在u的1.96个标准误差的范围之内 9简述样本量与置信水平,总体方差,允许误差之间的关系 样本容量:与置信水平成正比 与总体方差成正比 与边际误差的平方成反比 与允许误差成反比 10第一类错误和第二类错误分别指什么,他们发生的概率大小之间存在怎样的关系 第Ⅰ类错误(弃真错误): 原假设为正确时拒绝原假设 第Ⅰ类错误的概率记为( 被称为显著性水平 第Ⅱ类错误(取伪错误): 原假设为错误时未拒绝原假设 第Ⅱ类错误的概率记为(((Beta) (和( 的关系就像翘翘板,(小( 就大, (大( 就小 11什么是显著性水平?他对于假设检验决策有什么意义? (1)我们可以在事先确定用于拒绝原假设H0的证据必须强到何种程度。这等于说我们要求多小的P值。而这个P值就叫显著性水平,用(表示 显著性水平表示总体中某一类数据出现的经常程度 假如我们选择(=0.05,样本数据能拒绝原假设的证据要强到:当H0正确时,这种样本结果发生的频率不超过5%;如果我们选择(=0.01,就是要求拒绝H0的证据要更强,这种样本结果发生的频率只有1% (2)如果P值小于或等于( ,我们称该组数据不利于原假设的证据有(的显著性水平 意义:确认了显著性水平就等于是控制了第一类错误的概率,但是无法确定第二类错误的概率 12什么是方差分析?他研究的是什么? (1)检验多个总体均值是否相等 通过分析数据的误差判断各总体均值是否相等 (2)研究分类型自变量对数值型因变量的影响 一个或多个分类型自变量 两个或多个 (k 个) 处理水平或分类 一个数值型因变量 (3)有单因素方差分析和双因素方差分析 单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量 13方差分析有那些基本假设? (1)

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档