统计学复习相关资料.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学复习相关资料

第一章 统计学的概念 统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。 统计学的分类:描述统计和推断统计 描述统计:是用图形、表格和概括性的数字对数据进行描述的统计方法。 推断统计:是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。 统计数据误差的分类:非抽样误差和抽样误差 非抽样误差:是由于调查过程中各有关环节工作失误造成的。是可以避免的 抽样误差:是利用样本推断总体时产生的误差。是不可避免的,但可以计量和控制。 4.①总体:所研究的全部个体(数据) 的集合,是唯一的,确定的,其中的每一个个体也称为元素(总体单位)。总体容量N 分为有限总体和无限总体 ②样本:从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量或样本量n ③变量:是总体中个体单位所具有的特征或特性 变量的具体表现称为变量值,即数据 ④变量可以分为 分类变量(categorical variable) :说明事物类别的名称.如性别(男,女)特点:只能用文字表示,无大小,平行排列 顺序变量(rank variable):说明事物有序类别的名称。如产品等级。特点:只能用文字表示,有大小,可排序 数值型变量(metric variable) :说明事物数字特征的名称。如:成绩、年龄、产量。特点:可用数字表示。 分类变量和顺序变量属于定性变量 数值型变量属于定量变量 第二章 5.①统计数据的分组:是将预处理过的数据按照某种特征或标准分成不同的组别。 分组的作用:突出了组间差异,而掩盖了组内差异 ② 按定性指标分组-------品质标志分组 按定量指标分组-------数量标志分组 ③数量标志分组--编制次数分布表 单变量值分组:指每个组值只用一个具体的变量值表现的数列 编制条件:变量是离散变量,变量的不同取值个数较少。同时具备 组距分组:指每个组的变量值用一个区间来表现 编制条件:变量是连续变量; 或:总体单位数较多,变量不同取值个数也较多的离散变量。 等距分组:变量值变动区间的长度相等 异距分组:变量值变动区间的长度不完全相等 2.组限:指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限 注意:对于离散变量,相邻组组限可以间断,也可重叠; 对于连续变量,相邻组组限必须重叠 组距:每组变量值变动区间的长度,为上下限之差 组中值:每组变量取值范围的中点数值 图形图 ①条形图-----用于显示分类变量和顺序变量的次数分布 ②饼图--------用于显示内部结构 ③直方图-----用于显示数值型变量的次数分布 ④茎叶图-----用于显示数值型变量的次数分布及具体构成 ①众数:指总体中出现次数最多的变量值,用 表示,它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。 组距分组众数的确定: L表示众数所在组的下组限,表示众数组次数与前一组次数之差,表示众数组次数与后一组次数之差, i表示众数组的组距 ②中位数:将总体各单位标志值按大小顺序排列后,处于数列中间位置的标志值,用 表示。它不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。 未分组的数据 组距分组数据 L表示中位数所在组的下组限,表示中位数所在组一下各组的累积次数,表示中位数所在组的次数,i表示中位数所在组的组距。 中位数的数学性质:各变量值与中位数的离差绝对值之和最小,即 应用:主要用于定序数据,也可用数值型数据,但不能用于定类数据 5.均值的计算(前提:数据呈对称分布) ①算术平均数 未分组的数据 : 加权均值------数据已分组 --------决定平均数的变动范围 -------起到权衡轻重的作用 ②调和平均数:调和平均数,是各数据倒数的(简单)算术平均数的倒数 加权调和平均数 =乘以 注意:平均数=标志总量/单位数 如果知道分子,用加权调和平均数;如果知道分母,用加权算术平均数 ③几何平均数:是N项变量值连乘积的开N次方根 应用:用于计算现象的平均比率或平均速度 应用的前提条件:各个比率或速度的连乘积等于总比率或总速度; 相乘的各个比率或速度不为零或负值 ④切尾均值:去掉大小两端的若干数值后计算中间数据的均值 ⑤中位数、众数、均值三者的关系 离散程度 ①极差:指所研究的数据中,最大值与最小值之差(一般应用于对称、单峰、大样本) 优点:计算方法简单、易懂; 缺点:1、极差易受极端值的影响; 2、由于极差只利用了数据两端的信息,没有反映中间数据

文档评论(0)

kakaxi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档