- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 第二章 统计 单元复习 知识结构 统计 用样本估计总体 随机抽样 简单随机抽样 系统抽样 分层抽样 变量间的相关关系 用样本的频率 布估计总体分布 用样本的数字特征估计总体数字特征 线性回归分析 一 随机抽样 1. 简单随机抽样 (1)概念:设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样本, 如果每次抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样. 抽签法: 第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上. 第二步,将号签放在一个容器中,并搅拌均匀. 第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本. (2)步骤: 随机数表法: 第一步,将总体中的所有个体编号. 第二步,在随机数表中任选一个数作为起始数. 第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本. 2. 系统抽样 (1)概念:将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本. (2)步骤: 第一步,将总体的N个个体编号. 第二步,确定分段间隔k,对编号进行分段. 第三步,在第1段用简单随机抽样确定起始个体编号. 第四步,按照一定的规则抽取样本. 3. 分层抽样 (1)概念:若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本. (2)步骤: 第一步,计算样本容量与总体的个体数之比. 第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数. 第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体. 第四步,将各层抽取的个体合在一起,就得到所取样本. 适应范围 相互联系 抽样特征 共同 特点 方法 类别 简单随 机抽样 系统 抽样 分层 抽样 抽样过程中每个个体被抽取的概率相等 将总体分成均衡几部分,按规则关联抽取 将总体分成几层,按比例分层抽取 用简单随机抽样抽取起始号码 总体中的个体数较少 总体中的个体数较多 总体由差异明显的几部分组成 从总体中逐个不放回抽取 用简单随机抽样或系统抽样对各层抽样 二、用样本估计总体 频率分布 数字特征 频率分布表 频率分布直方图 频率分布折线图 总体密度曲线 茎叶图 众数、中位数 平均数 标准差、方差 4. 频率分布表 (1)含义:表示样本数据分布规律的表格. (2)作法: 第一步,求极差. 第二步,决定组距与组数. 第三步,确定分点,将数据分组. 第四步,统计频数,计算频率,制成表格. 5. 频率分布直方图 (1)含义:表示样本数据分布规律的图形. (2)作法: 第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度. 第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形. 6. 频率分布折线图 在频率分布直方图中,依次连接各小长方形上端中点得到的一条折线,称为频率分布折线图. 7. 总体密度曲线 当总体中的个体数很多时,随着样本容量的增加,所分的组数增多,组距减少,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 频率分布表 频率分布直方图 频率分布折线图 连接各小长方形上端的中点 总体密度曲线 样本容量不断增大,频率折线图接近于一条光滑曲线 8. 茎叶图 作法: 第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分; 第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧; 第三步,将各个数据的叶按大小次序写在茎右(左)侧. 9. 众数、中位数和平均数 众数:频率分布直方图最高矩形下端中点的横坐标. 中位数:频率分布直方图面积平分线的横坐标. 平均数:频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和. 10.标准差 11. 相关关系 自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系. 12. 散点图 在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图. 三、用样本估计总体 如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 13. 回归直线 14. 回归方程 巩固练习 例1 为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生的成绩进行统计分析,在这个问题中,5000名学生成绩的全体是 ( ) A. 总体 B. 个体 C.
文档评论(0)