- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第13章统计知识结构
第十三章 统计知识结构
【知识概要】
一、抽样方法
●1. 简单随机抽样——设一个总体的总数为N,若通过逐个抽取的方法从总体中抽取一个样本,且每次抽取时,各个个体被抽到的概率相等,这样的抽样方法叫简单随机抽样。
特点:不放回抽样;逐个抽取;被抽取的样本的总数是有限的。
主要方法:抽签法;随机数表法。
●2. 系统抽样——将总体平均分成几个部分,然后按照预先定出的规则,从每个部分中抽取一个个体,得到所需的样本,这样的抽样方法叫简单系统抽样。
特点:等概率抽样;等距离(或按预先定出的规则)抽样;不放回抽样。
系统抽样的步骤:
①采用随机的方式将总体中的个体编号;
②将整个的编号按一定的间隔(设为k),当(N为总体中的个体数,n为样本容量)是整数时, 当不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数能被n整除,这时,并将剩下的总体重新编号;
③在第一段中用简单随机抽样确定起始的个体标号l;
④将编号为的个体抽出。
●3. 分层抽样——当总体由差异明显的几个部分组成时,将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比进行抽样,这样的抽样方法叫分层抽样。
特点:每层抽取的样本数=;等概率抽样;不放回抽样。
分层抽样的步骤:
①将总体按一定标准分层;
②计算各层的个数与总体的个数的比;
③按各层个数占总体的个数的比确定各层应抽取的样本容量;
④在每一层进行抽样(可用简单随机抽样或系统抽样)。
二、总体分布的估计和总体特征数的估计
●1. 频率分布表的有关概念
(1)频数: 在一组数据中,某范围内的数据出现的次数;
(2)频率: 频数除以数据的总个数;
(3)全距: 数据中最大与最小值的差;
(4)组距=;
(5)分组要求:通常对组内数值所在区间取左开右闭区间,最后一组取闭区间,并且使分点比数据多一位小数。
●2. 频率分布直方图
具体做法如下:
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图:
① 横轴表示样本数据,纵轴表示频率与组距的比值;
② 以每个组距为底,以各频率除以组距的商为高,分别画成矩形;
③ 图中每个矩形的面积等于相应组的频率,即:;
④ 各组频率的和等于1,即各小矩形的面积的和等于1。
●3. 频率分布折线图:将频率分布直方图中,取各相邻矩形的上底边中点顺次连接,再将矩形的边去掉,就得到频率分布折线图。
●4. 密度曲线:当样本容量取得足够大,分组的组距取得足够小,则这条折线就越接近于一条光滑的曲线,这条光滑的曲线称为总体密度曲线。
●5. 中位数:将数据按从小到大或从大到小排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数。
●6. 众数:在一组数据中出现次数最多的数叫做这组数据的众数;众数不一定是唯一的。
●7. 平均数计算的方法:
(1)简单平均数;
(2)离散型平均数计算:所发生的频率分别为,则平均数为;
(3)区间型平均数计算:所发生的频率分别为,则平均数为
●8. 方差:
●9. 标准差:
三、统计案例
●1. 回归分析
回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。对具有相关关系的两个变量进行统计分析的方法叫回归分析。
线性回归方程:设与是具有相关关系的两个变量,且相应于个观测值的个点大致分布在某一条直线的附近,就可以认为对的回归函数的类型为直线型:,我们称这个方程为对的线性回归方程。
(1)设两个具有线性相关的一组数据为:
则线性回归方程为:其中,
分别为,的算术平均数。
(2)特点:线性回归方程过点;
●2. 相关系数
对于变量y与x的一组观测值,
把叫做变量y与x之间的样本相关系数,简称相关系数,用它衡量两个变量之间的线性相关程度。
相关系数的性质:≤1,且越接近1,相关程度越大;越接近0,相关程度越小。
●3独立性检验
独立性检验是对两种分类变量之间是否有关系进行检验。
① 独立性检验的必要性:2×2列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体。
② 独立性检验的原理(与反证法类似):
反证法 假设检验 要证明结论A 备择假设H 在A不成立的前提下进行推理 在H不成立的条件下,即H成立的条件下进行推理 推出矛盾,意味着结论A成立 推出有利于H成立的小概率事件(概率不超过的事件)发生,意味着H成立的可能性(可能性为(1-))很大 没有找到矛盾,不能对A下任何结论,即反证法不成功 推出有利于H成立的小概率事件不发生,接受原假设
③ 独立性检验的步骤
第一步:提出假设检验问题;
第二步:选择检验的
您可能关注的文档
最近下载
- 初中道德与法治新人教版七年级上册全册教案(2024秋).pdf VIP
- 2025年无犯罪记录证明申请表申请书(模板).docx VIP
- 《新媒体营销基础》课件——新媒体营销概述.pptx VIP
- 项目计划进度管理流程图.pdf VIP
- 2024广播电视播音员主持人考试历年机考真题集附答案详解【考试直接用】.docx VIP
- 200MWh储能电站安全预评价报告.doc VIP
- 华为经营管理-华为的流程管理(6版).doc VIP
- 2015-2020年一建历年真题-水利.pdf VIP
- 平行文本在翻译中的运用.ppt VIP
- 口腔医疗行业市场规模增长与竞争格局分析报告:2025年市场展望.docx
文档评论(0)