统计学名次解释简答题整理解析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
截面数据:在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况。 总体:是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。可分为有限总体和无限总体。 样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。 参数(对应总体)是用来描述总体特征的概括性数字度量,是研究者想要了解总体的某种特征值。 统计量(对应样本)是用来描述样本特征的概括性数字度量。是根据样本数据计算出来来的一个量,由于抽样时随机的,因此统计量是样本的函数。 调查方法:普查,抽样调查,统计报表 抽样误差:是有抽样的随机性引起的样本结果与总体真值的误差。 非抽样误差:由于其他原因引起的样本观察结果与总体真值之间的差异。 集中趋势:一组数据向某一中心值靠拢的程度,反映了一组数据中心点的位置所在 众数(分类数据):是一组数据中出现次数最多的变量值,用M表示。 中位数(顺序数据):一组数据排序后处于中间位置上的变量值。 四分位数(顺序数据):也称四分位点,是一组数据排序后处于25%(下四分位数)和75%(上四分位数)位置上的值。 平均数:是一组数据相加后除以数据的个数得到的结果。 异众比率:非众数组的频数占总频数的比例,用V表示。 极差:一组数据的最大值与最小值只差成为极差,也称全距,用R表示。 平均差:也称平均绝对利差,是各变量值与其平均数离差绝对值的平均数,用M表示。 标准分数:变量值与其平均数的离差除以标准差后的值成为标准分数,也称标准化值或Z分数。 离散系数:也成为变异系数,是一组数据的标准差与其相应的平均数之比。 区间估计:是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。 置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,区间的最小值称为置信下限,最大值称为置信上限。 置信水平:如果将构造置信区间的步骤重复多次,置信区间中包含总体参数针织的次数所占的比例称为置信水平,为成为置信度或置信系数。 t分布:类似正态分布的一种对称分布,通常要比正态分布平摊和分散。 匹配样本:一个样本中的数据与另一个样本中的数据相对应。 错误(弃真错误):原假设H为真却被我们拒绝了,烦这种错误的概率用表示 错误(取伪错误):原假设为伪我们却没有拒绝,犯这种错误的概率用表示。 P值:当原假设为真时所得到的样本观察结果或更极端结果出现的概率。P值越小,我们拒绝原假设的理由越充分。 直方图:用一系列宽度相等,高度不相等的长方形表示数据的图,长方形的宽度表示数据范围的间隔,长方形的高表示在间隔内的数据数。 数据透视表:是一种交互式的表,可以进行某些计算,如求和与计数等。所进行的计算与数据跟数据透视表中的排列有关。 残差:指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。 误差:测量值与真实值之间的差异称为误差。 统计学 :是收集、分析、表述和解释数据的科学。 简单随机抽样:从含有N元素的总体中,抽取n个元组作为样本,使得每一个容量 为n的样本都有相同的机会被抽中,这样的抽样方式称为简单随机抽样。 方差分析:检验多个总体均值是否相等的统计方法,称为方差分析。 估计值:指用来估计总体参数时计算出来的估计量的具体数值。 估计总体均值时样本容量的确定与哪些因素有关,并写出相关计算公式? 答:因素有:①总体方差,总体方差越大,所需n越大; ②允许的极限误差△ ,△越大所需n越小; ③可靠性或1-α的大小,可靠性越高,所需n越大。 计算公式: 试简单分析P值与α之间的含义、区别和使用规则? 答:①显著性水平是指当原假设为真时却被拒绝的概率; ②P值为若原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率; ③是可以事先确定,而P值是通过计算得到的; ④值是衡量小概率的标准,P值可以与小概率标准/2或进行比较来判断是拒绝H0还是接受H0。Pa,不能拒绝H0,pa,拒绝H0。 什么是参数最小二乘估计? 最小二乘法是指使因变量的观察值与估计值之间的残差平方和SSE达到最小来求得和的方法(5分),即(2分)然后对该式求相应于和的偏导数并令其等于零,便可求出和(3分)。 试述“小概率原理”在假设检验中的作用? “小概率原理”是指发生概率很小的随机事件在一次实验中是几乎不可能发生的(5分);它是假设检验的基本原理,根据这一原理,可以做出是否拒绝原假设的决定(5分)。 简述假设检验的一般步骤。 建立假设—确定显著性水平—计算统计量—确定概率值P—做出判断结论。 二手资料与一手资料有何不同?使用二手资料时应注意哪些问题? 二手资料是指与研究内容有关的信息,只需重新加工、整理的资料(2分);而一手资料是指必须通过调查和实验

文档评论(0)

四娘 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档