- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学的复习提要
第一章数据与统计
一、统计
统计的三种含义:统计活动(统计工作)、统计数据(统计资料)和统计学。
二、数据
1、统计数据的四种计量尺度
定类尺度、定序尺度、定距尺度和定比尺度
数据类型(依据四种不同的计量尺度分为)
分类数据、顺序数据、数值型数据
3、常用的统计调查组织方式:
(1)普查:为某一特定的目的而专门组织的一次性全面调查方式。
(2)抽样调查:从总体中抽取样本进行调查,利用样本调查的结果对总体的特征进行推断的一种非全面调查方式。
(3)统计报表:按照规定,自上而下统一布置,自下而上逐级填报的一种调查组织方式。
(4)重点调查:从总体中选择少数重点单位进行调查的调查组织方式。
(5)典型调查:从总体中选择一个或几个代表性的单位深入细致调查的一种调查组织方式。
第二章描述统计
定性数据的图表分析
频数分布
频数和频率
(2)频数分布
图形表示
主要有条形图、饼图和环形图等。
二、定量数据的图表分析
1、定量数据分组
单变量分组
单变量分组是把一个变量值作为一组,这种方法一般适用于离散型变量且数目较少的情况。
组距分组
组距分组是将全部变量值依次划分为若干个数值区间,每一个数值区间作为一组,这种方法一般适用于离散型变量变量值较多或者连续型变量。
注意:分组过程中,为解决“不重”问题,采用“上限不在内”的原则;
对于开口组,如何确定首组的下限和末组的上限?以及如何计算组中值?
2、图形表示
主要有直方图、折线图、茎叶图和箱线图、散点图。
第三章描述统计:数值方法
集中趋势测度
重点会计算各种刻画集中趋势的测度值。
平均数(适用于数值型数据)算术平均数
众数
(1)一组数据中出现次数最多的变量值
(2)不受极端值的影响
(3)一组数据可能没有众数或有几个众数
(4)不仅适用于数值型数据也适用于分类数据和顺序数据
注意:对于组距分组数据,如何计算众数?
中位数
(1)排序后处于中间位置上的值
(2)不受极端值的影响
(3)主要用于顺序数据,也可用数值型数据,但不能用于分类数据
注意:如何计算中位数?
四分位数如何计算1/4四分位数和3/4四分位数?
均值、众数和中位数的关系
(1)对称 (2)左偏分布 (3)右偏分布
离散趋势测度
重点会计算各种刻画离中趋势的测度值。
全距
一组数据的最大值与最小值之差
R = max(xi) - min(xi)
2、内距(四分位数差)
上四分位数与下四分位数之差。
3、方差与标准差
重点计算总体方差与标准差和样本的方差与标准差。(未分组数据和分组数据)
4、标准分数
数据标准化
5、离散系数(标准差系数)
(1)什么是离散系数?标准差与均值的比值。
(2)为什么计算离散系数?
三、分布形态的度量
1、分布的对称性
偏态:数据分布的不对称性。
2、分布的陡峭性
峰度:数据分布的平峰或尖峰程度。
第四章抽样及抽样分布
一、六种常用抽样技术
简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样以及不等概率抽样
二、抽样分布
1、样本均值的抽样分布
(1)当总体服从正态分布 时,来自该总体的所有容量为n的样本的均值(x也服从正态分布,(x 的数学期望为μ,方差为σ2/n。即(
(2)设从均值为(,方差为( 2的一个任意总体中抽取容量为n的样本,当n充分大时(n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布
2、样本比例的抽样分布
当样本容量n足够大时(即np≥10,n(1-p) ≥10),样本比例p近似服从均值为π 、方差为π(1-π)/n的正态分布。
3、样本方差的抽样分布
当总体 ,从中抽取容量为n的样本,则
参数估计
两种参数估计
点估计:用样本估计量的某个值直接作为总体参数的估计值。
区间估计(置信区间,可靠性)
评价点估计量的标准
无偏性 有效性 一致性:
二、一个总体参数的区间估计
1、总体均值的区间估计
(1)总体服从正态分布,且方差((2) 已知
(2)总体服从正态分布,且方差((2) 未知
(3)非正态总体均值的区间估计(大样本)
2、总体比例的区间估计
3、总体方差的区间估计
三、样本容量的确定
1、估计总体均值时样本容量的确定
2、估计总体比例时样本容量的确定
第六章 假设检验
假设检验的基本问题
1、什么是第一类和第二类错误?
2、双侧检验、右侧检验和左边检验
二、一个总体参数的检验
1、总体均值的检验
2、总体比例的检验
3、总体方差的检验
第八章相关与回归分析
相关分析
1、相关关系的定义
2、相关关系的类型
3、相关系数的性质
二、一元线性回归
1、一元线性回归模型
误差项是不可测随机变量,假定服从期望为0,方差为Q2的正态分布。反映了除 x 和
文档评论(0)