统计学基础考试辅助复习资料.docxVIP

统计学基础考试辅助复习资料.docx

本文档由用户AI专业辅助创建,并经网站质量审核通过;此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

统计学基础考试辅助复习资料

各位同学,统计学是一门研究数据的科学,它帮助我们从看似杂乱无章的数据中提取信息、发现规律、做出推断。面对即将到来的统计学基础考试,这份复习资料旨在帮助大家梳理核心知识点,巩固重点内容,提升应试能力。请结合教材和课堂笔记,系统复习。

一、基本概念与术语

统计学的基石在于对基本概念的准确理解和运用。

1.统计总体与总体单位(个体):

*统计总体:简称总体,是指客观存在的、在同一性质基础上结合起来的许多个别事物的整体。构成总体的必要条件:同质性、大量性、差异性。

*总体单位(个体):构成总体的每一个基本单位。随着研究目的的不同,总体和总体单位可以相互转化。

2.样本与样本量:

*样本:从总体中按一定方式抽取出来的部分个体所组成的集合。样本是总体的代表,用于推断总体特征。

*样本量:样本中所包含的个体数目,通常用`n`表示。

3.标志与指标:

*标志:说明总体单位特征的名称。按性质可分为品质标志(表示属性,如性别、职业)和数量标志(表示数量,如年龄、收入)。

*指标(统计指标):说明总体数量特征的概念及其数值。具有综合性、可量性。

4.变量:

*指可变的数量标志或统计指标。

*定性变量(品质变量):取值为类别属性,如性别(男、女)、学历。

*定量变量(数量变量):取值为数值,可进行数学运算。

*离散变量:取值为有限个或可数个孤立数值,如企业数、学生人数。

*连续变量:取值为某一区间内的任意实数,如身高、体重、时间。

5.数据类型:

*截面数据:同一时间点上不同总体单位的数据。

*时间序列数据:同一总体单位在不同时间点上的数据。

6.统计学的两大分支:

*描述统计学:研究如何收集、整理、显示数据,并通过综合、概括与分析,得出反映客观现象的数据特征。

*推断统计学:研究如何根据样本数据推断总体数量特征的方法,包括参数估计和假设检验。

二、数据的描述性统计

描述性统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。

2.1数据的整理与展示

1.统计分组:

*根据研究目的,将总体按某个或某几个标志划分为若干不同性质的组。

*原则:穷尽原则、互斥原则。

*种类:品质分组、数量分组(单项式分组、组距式分组)。

2.频数分布表:

*将数据分组后,列出各组的组别及相应的频数(或频率)形成的表格。

*频数:各组中包含的总体单位数。

*频率:各组频数与总频数之比,通常用百分数表示。

*累计频数(频率):向上累计、向下累计。

3.统计图:

*条形图:用于展示不同类别数据的频数或频率,各条形通常分开排列。

*直方图:用于展示连续型数值数据的频数分布,矩形连续排列,宽度表示组距,高度表示频数或频率密度。注意与条形图的区别。

*饼图:用于展示分类数据中各组成部分的构成比,总和为100%。

*折线图:用于展示数据随时间或另一变量变化的趋势。

*散点图:用于展示两个数值变量之间的关系。

*箱线图:用于展示数据的分布特征,包含中位数、四分位数、最大值、最小值和异常值。

2.2集中趋势的度量

集中趋势是指一组数据向某一中心值靠拢的程度,它反映了数据的一般水平。

1.算术平均数(均值):

*简单算术平均数:适用于未分组数据,所有数据之和除以数据个数。

*加权算术平均数:适用于分组数据,各组组中值乘以相应频数后求和,再除以总频数。

*优点:利用了所有数据的信息,反应灵敏。

*缺点:易受极端值(异常值)的影响。

2.中位数:

*将一组数据按大小顺序排列后,处于中间位置的变量值。

*对于未分组数据,位置为`(n+1)/2`(n为奇数)或中间两个数的平均(n为偶数)。

*优点:不受极端值影响,稳健性好。

*缺点:没有充分利用所有数据的信息。

3.众数:

*一组数据中出现次数最多的变量值。一组数据可能有一个众数、多个众数或没有众数。

*优点:不受极端值影响,适用于定性数据和定量数据。

*缺点:可能不唯一,信息量较少。

4.几何平均数:

*n个变量值乘积的n次方根,主要用于计算平均比率或平均发展速度。

2.3离散程度的度量

离散程度反映的是数据远离中心值的程度,与集中趋势一起描述数据的整体特征。

1.极差(全距):

*一组数据中最大值与最小值之差。

*优点:计算简便。

*缺点:只利用了两端点值,易受极端值影响,不能反映中间数据的分散情况。

2.方差与标准差:

*

文档评论(0)

135****9152 + 关注
实名认证
文档贡献者

多年教师,工作经验非常丰富

1亿VIP精品文档

相关文档