《统计复习资料.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《统计复习资料

统计学复习资料 第一章 导论 1.统计学:是收集、处理、分析、解释数据并从数据中得出结论的科学。 2.统计方法:描述统计和推断统计(参数统计和假设检验)。 3.统计数据的分类:A.按计量层次:分类数据、顺序数据、数值型数据。 B.按收集方法:观察数据、实验数据。 C.按时间状况:截面数据、时序数据。 4.总体:所研究的全部个体(数据)的集合,其中的每个个体也称为元素。(分为有限总体和无限总体) 样本:从总体中抽取的一部分元素的集合。 参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。(总体均值υ、标准差σ、总体比列π) 统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数(样本均值 、样本标准差 、样本比列 ) 变量:说明现象某种特征的概念(分为分类变量、顺序变量、数值型变量) 第二章 数据的收集 1.概率抽样:也称随机抽样。 特点:按一定的概率以随机原则抽取样本; 每个单位被抽中的概率是已知的,或是可以计算出来的; 当用样本对总体目标进行估计时,要考虑到每个样本单位被抽中的概率。 方式:简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样 2.非概率抽样:相对于概率抽样而言。抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。 方式:方便、判断、自愿、滚雪球、配额抽样等方式。 3.收集数据的基本方法:A.调查的数据:自填式、面访式、电话式 B.实验的数据 4.各调查方法的比较: 自填式 面访式 电话式 调查时间 慢 中等 快捷 调查费用 低 高 低 问卷难度 要求容易 可以复杂 要求容易 有形辅助物的使用 中等利用 充分利用 无法利用 调查过程控制 简单 复杂 容易 调查员作用的发挥 无法发挥 充分发挥 一般发挥 回答率 最低 较高 一般 5.抽样误差:由抽样的随机性所带来的误差 影响其误差大小的因素:样本量的大小、总体的变异性 6.非抽样误差:除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异,存在于所有的调查之中(概率抽样、非概率抽样、全面性调查) 第四章 数据的概括性度量(计算题) 1.众数(主要适用于分类数据的测度,也可适用于顺序和数值型数据):数据中出现次数最多的变量值;不受极端值影响; 2.中位数:主要用于顺序数据,也可用于数值型数据,但不能用于分类数据; 3.四分位数:顺序数据 4.平均数:也称均值,数值型数据,可分为简单、加权、几何平均数 5.众数、中位数、平均数的特点和应用 A.众数:不受极端值影响;具有不唯一性;数据分布偏斜程度较大且有明显峰值时应用 B.中位数:不受极端值影响;数据分布偏斜程度较大时应用 C.平均数:易受极端值影响;数学性质优良;数据对称分布或接近对称分布时应用 6.众数、中位数和平均数的关系:(简答题) 如果数据的分布是对称的,众数、中位数和平均数必定相等 如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者关系表现为:平均值小于中位数小于众数 如果数据右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,则众数小于中位数小于平均数 7.离散程度的度量 A.异众比率(分类数据):对分类数据离散程度的测度,非众数组的频数占总频数的比列;用于衡量众数的代表性 B.四分位差(顺序数据):对顺序数据离散程度的测度,也称内距或四分间距(掌握计算);反应中间50﹪数据的离散程度,不受极端值影响;用于衡量中位数的代表性 C.方差和标准差(计算):数据离散程度的最常用测度值;反映各变量值与均值的平均差异;根据总体数据计算的,称为总体方差,记为 ;根据样本数据计算的称为样本方差 计算公式: 8.自由度:是指数据个数与附加给独立的观测值得约束或限制的个数之差(如果对n个观测值附加的约束个数为k个,自由度则为n-k) 9.相对位置的度量:标准分数 标准分数也称标准比值;对某一值在一组数据中相应位置的度量;可用来判断一组数据是否有离群点;用于对变量的标准化处理 10.切比雪夫不等式:如果一组数据不是对称分布,经验法则就不在适用,这时可使用切比雪夫不等式,它对任何分布形状的数据都适用;它提供的是“下界”,也就是“所占比列至少是多少”;对于任意分布形态的数据,根据它,至少有1-1/k2的数据落在平均数加减k个标准差之内,其中k是大于1的任意值,但不一定是整数。 P102不等式含义自看 1

文档评论(0)

shit0605 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档