- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第九章统计与成对数据的统计分析
1.简单随机抽样
(1)简单随机抽样分为放回简单随机抽样和不放回简单随机抽样(除非特殊声明,本章所指的简单随机抽样是指不放回简单随机抽样).
(2)简单随机样本:通过简单随机抽样获得的样本称为简单随机样本.
(3)简单随机抽样的常用方法:抽签法和随机数法.
(4)不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
【注意】简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.(一次性抽取和逐个不放回抽取是等价的)
2.分层随机抽样
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)比例分配的分层随机抽样所获得样本的均值与方差
利用比例分配的分层(两层)随机抽样获得的样本中,第一层的样本量为,均值为,方差为;
第二层的样本量为,均值为,方差为,则总的样本均值,总的样本方差
.
(3)分层随机抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比;
抽样比=eq\f(该层样本量n,总样本量N)=eq\f(该层抽取的个体数,该层的个体数)
3.统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等.
(2)频率分布直方图中小长方形高=eq\f(频率,组距);频率分布直方图中各小长方形的面积之和为1.
(3)频率分布直方图中的数字特征
①众数:最高的矩形底边中点的横坐标.
②中位数:中位数左边和右边的矩形的面积和是相等的.
③平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个矩形的面积乘以小长方形底边中点的横坐标之和.
4.百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
5.计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
6.四分位数
第25百分位数(下四分位数),第50百分位数,第75百分位数(上四分位数),这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
7.众数、中位数、平均数
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把称为这个数的平均数.
8.标准差与方差
设一组数据的平均数为,则这组数据的标准差和方差分别是,.
9.总体(样本)方差和总体(样本)标准差
(1)一般式:如果总体中所有个体的变量值分别为,总体平均数为,则总体方差.
(2)加权式:如果总体的个变量值中,不同的值共有个,不妨记为,其中出现的频数为,则总体方差为.
【注意】(1).若的平均数为,那么的平均数为.
(2).数据与数据的方差相等,即数据经过平移后方差不变.
(3).若的方差为,那么的方差为.
10.变量的相关关系
(1)相关关系的分类:正相关和负相关.
(2)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
11.样本相关系数
(1)相关系数r的计算
变量x和变量y的样本相关系数r的计算公式如:.
(2)相关系数r的性质
①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系.
②样本相关系数的取值范围为.
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
12.一元线性回归模型
(1)我们将称为y关于x的经验回归方程,其中
.
(2)残差=观测值-预测值
(3)决定系数:,R2越大,即拟合效果越好,R2越小,模型拟合效果越差.
13.列联表与独立性检验
(1)关于分类变量X和Y的抽样数据的2×2列联表
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
记,则随机变量.
(2)独立性检验
基于小概率值α的检验规则是:
当时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断H0不成
您可能关注的文档
最近下载
- 智慧城市云计算大数据中心项目深化设计方案(403页word).docx VIP
- 全国高中青年数学教师优质课大赛一等奖《基本不等式》教学设计.doc VIP
- 中华民族共同体概论第一讲 中华民族共同体基础理论part1.pptx VIP
- 儿童绘本改编与创作教案.pdf VIP
- JGJ-T291-2012:现浇塑性混凝土防渗芯墙施工技术规程.pdf VIP
- 实施指南《GB_T18944.2-2022柔性多孔聚合物材料海绵和发泡橡胶制品规范第2部分:模制品与挤出制品》实施指南.docx VIP
- 2022新能源风电场接入集控中心技术方案.doc VIP
- 白头翁的故事培智.ppt VIP
- 应聘人员登记表单.docx VIP
- 5S_培训教材.ppt VIP
文档评论(0)