统计学重点名词解释.docVIP

下载本文档

96
0
约2.5千字
约 2页
2020-04-21 发布于江西
举报
版权申诉

统计学重点名词解释.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

1、数据类型：分类数据：只能归于某一类别的非数字型数据，它是对事物进行匪类的结果，数据表现为类别，是用文字来表述。（定性数据或品质数据）顺序数据：只能归于某一有序类别的非数字型数据。有类别，但类别是有序的。（定性数据或品质数据）数值型数据：按数字尺度测量的观察值，其结果表现为具体的数值。现实中所处理的大多数都是数值型数据。(定量数据或数量数据) 2、截面数据：在相同或近似相同的时间点上收集的数据，这类数据通常是在不同的空间上获得的，用于描述现象在某一时刻的变化情况。 3、总体：是包含所研究的全部个体（数据）的集合，它通常由所研究的一些个体组成。可分为有限总体和无限总体。 4、样本：从总体中抽取的一部分元素的集合，构成样本的元素的数目称为样本量。 5、参数（对应总体）是用来描述总体特征的概括性数字度量，是研究者想要了解总体的某种特征值。 6、统计量（对应样本）是用来描述样本特征的概括性数字度量。是根据样本数据计算出来来的一个量，由于抽样时随机的，因此统计量是样本的函数。 7、调查方法：普查，抽样调查，统计报表 8、抽样采集数据的方式分为概率抽样和非概率抽样。 9、概率抽样：简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样。 10、非概率抽样：方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样。 11、搜集数据的基本方法：自填式、面访式、电话式 12、数据的误差：抽样误差和非抽样误差抽样误差：是有抽样的随机性引起的样本结果与总体真值的误差。非抽样误差：相对抽样误差而言的，初抽样误差之外的，由于其他原因引起的样本观察结果与总体真值之间的差异。 13、集中趋势：一组数据向某一中心值靠拢的程度，反映了一组数据中心点的位置所在 14、众数（分类数据）：是一组数据中出现次数最多的变量值，用M表示。众数主要用于测度分类数据的集中趋势，当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。众数是一个位置代表值，他不受数据中极端值的影响。从分布的角度看，众数是具有明显集中区试点的数值，一组数据分布的最高峰点所对应的数值即为众数。 15、中位数（顺序数据）：一组数据排序后处于中间位置上的变量值，用M表示。中位数主要用于测度顺序数据的集中趋势，也适用于测度数值型数据的集中趋势，但不是用于分类数据。中位数是一个位置代表字号，特点是不受极端值的影响，在研究收入分配时很有用。 16、四分位数（顺序数据）：也称四分位点，是一组数据排序后处于25%（下四分位数）和75%（上四分位数）位置上的值。四分位数是通过3个点将全部数据等分为4部分，每部分包含25%的数据。 17、平均数也称均值，是一组数据相加后除以数据的个数得到的结果。 18、异众比率：非众数组的频数占总频数的比例，用V表示。异众比率主要用于衡量众数对一组数据的代表程度。异众比率越大，说明非众数组的频数占总聘书的比重约达，众数的代表性越差，越小，说明占总频数的比重越小，众数的代表性越好。主要是和测度分类数据的离散程度，对于顺序数据以及数值型数据也可以计算异众比率。 19、极差：一组数据的最大值与最小值只差成为极差，也称全距，用R表示。 20、平均差：也称平均绝对利差，是各变量值与其平均数离差绝对值的平均数，用M表示。 21、标准分数：变量值与其平均数的离差除以标准差后的值成为标准分数，也称标准化值或Z分数。 22、相对离散程度：离散系数：也成为变异系数，是一组数据的标准差与其相应的平均数之比。离散系数是测度数据离散程度的相对统计量，主要是用于比较不同样本数据的离散程度。离散系数大，说明数据的离散程度也大；小，说明数据的离散程度也小。 23、偏态：是对数据分布对称性的测度。测度偏态的统计量是偏态系数，记作SK。如果分布式对称的，则偏态系数等于0。大于1或小于-1，成为高度偏态分布，在0.5-1或-1到--0.5，被认为是中等偏态分布；越接近0，偏斜程度越低。0.4表示右偏，偏斜程度不大。SK为正值时，表示正离差值较大，可以判断为正偏或右偏；负值时，表示负离差值较大，判断为负偏或左偏。数值越大，偏斜程度越大。 24、峰态：是对数据分布平峰或尖锋程度的测度。测度峰态的统计量是峰态系数。峰态通常是与标准正态分布相比较而言的。服从标准正态分布，峰态系数的值等于0；不等于0，表明分布比正态分布更平或更尖，通常称为平峰分布或尖峰分布。当K0，尖峰分布，数据的分布更集中；小于0，扁平分布，数据的分布越分散。 25、中心极限定理：设从均值为，方差为（有限）的任意一个总体中抽取样本量为n的样本，当n充分大是，样本均值的抽样分布近似服从均值为，方差为/n的正态分布。 26、区间估计：是在点估计的基础上，给出总体参数估计的一个区间范围，该区间通常由样本统计量加减估计误差得到。 27、置信区间：在区间估计中，由