江立华-社会调查教程(第七版)第14章 统计分析.pptxVIP

  • 2
  • 0
  • 约 40页
  • 2023-03-23 发布于浙江
  • 举报

江立华-社会调查教程(第七版)第14章 统计分析.pptx

江立华-社会调查教程(第七版)第14章统计分析

第十四章 统计分析 描述统计和推断统计双变量统计分析统计分析概述单变量统计分析多变量统计分析 第一节 统计分析概述 一、统计分析及其目的统计分析,就是运用统计学原理和方法处理调查所获得的数据资料,简化和描述数据资料、揭示变量之间的统计关系,并进而推断总体的一整套程序和方法。 二、统计分析的过程数据录入和数据清理数据预处理数据统计分析数据预处理,就是对清理后数据做预备性处理,一般包括缺损值处理、加权处理、变量重新编码、数据重新排序,以及创造新变量等等。数据统计分析,就是调用统计软件中的各种统计程序对数据进行分析,包括单变量、双变量、多变量统计分析,以及制作统计图、统计表等一系列工作。 三、统计分析的层次 第二节 描述统计与推断统计 描述统计与样本、总体有关,与变量多少无关主要是计算样本的统计量,不对总体做推断描述性研究只涉及变量多少,而不涉及样本或总体问题 只关于“是什么”,只做描述不做解释,通常只涉及单个变量一、描述统计及其内容 二、推断统计与抽样分布抽样原理 三、推断统计的两种基本形式统计量:由样本计算出来的统计值参数:总体统计值参数估计,就是运用样本统计量对总体参数进行推断或估计的统计过程与统计方法(一)参数估计 三、推断统计的两种基本形式(一)参数估计1.点值估计点值估计的最大缺陷就是无法知道估计的误差到底有多大。因此,在实际研究工作中通常选择另一种参数估计方法,即区间估计法。 三、推断统计的两种基本形式(一)参数估计2.区间估计就是用一个数值区间表示未知总体参数落入该区间的概率或可能性有多大的一种统计方法。置信区间置信水平置信区间是指进行区间估计时,在某一概率水平下总体参数所处的数值区间。区间的上、下限(端点)称为临界值,所确定的概率水平称为置信水平或置信度,以概率1-α表示,α称为显著性水平,表示该区间估计的不可靠性程度,即估计参数位于该区间时可能犯错误的概率。1-α则表示估计参数落入置信区间的可靠性程度或把握度。 三、推断统计的两种基本形式(一)参数估计2.区间估计样本均值的抽样分布具有的特性是:总体平均数或抽样分布平均数处于样本平均数±1.96个抽样分布标准差范围内的概率为95%;处于样本平均数±2.58个抽样分布标准差范围内的概率为99%δ在95%的置信水平条件下,总体平均数的置信区间 =在99%的置信水平条件下,总体平均数的置信区间 = 三、推断统计的两种基本形式(二)假设检验假设检验是以抽样分布原理为基础,检验调查样本中的统计特性是否在总体中同样存在的一种统计方法参数估计假设检验相同点从样本出发去推断总体必须是通过随机抽样调查得来的数据从样本出发去推断总体必须是通过随机抽样调查得来的数据不同点用具体的样本统计量来推断总体参数检验样本中的事实、关系在总体中是否也存在 三、推断统计的两种基本形式(二)假设检验进行假设检验,必须首先建立两个假设,即虚无假设和备择假设(替换假设或研究假设)虚无假设备择假设含义假设在样本中观察到的事实或变量之间的关系在总体中并不存在,样本中出现的这种情形是由于抽样误差造成的假设在样本中出现的情况并不是抽样误差,在总体中也同样存在性质是一个关于“不存在”的假设,用H0表示是关于“存在”的假设,用H1表示 假设检验的数理基础“小概率事件在一次抽样中不可能出现原理”即小概率事件在通常情况下是不可能出现的,如果居然在一次抽样中出现了,则有理由认为存在其他原因而拒绝H0。三、推断统计的两种基本形式(二)假设检验 第三节 单变量统计分析 一、集中量数分析集中量数分析,是指用一个具体的统计量反映一组数据向该统计量集中趋势的统计方法,它所表示的是一组数据集中的程度或水平。平均数是最常用的集中量度,但它往往受极端数据的影响,使平均数反映数据整体集中趋势的准确性变得面目全非;当一组数据中存在极端数据、或数据中有个别数据不准确、不清楚的情况下,中位数能比平均数更准确、更稳定地反映数据整体的集中趋势;众数的优点是适用于所有类型的数据,另外在需要快速而又粗略地找出一组数据的代表值时,众数比平均数、中位数都更能表现出其优越性 二、离散量数分析集中量数反映的是数据整体的平均水平和典型情况离散量数反映数据整体的分散性、变异性等情况所谓离散量数,就是表示一组数据变异程度或分散程度的量数常用的离散量数是方差与标准差、全距、异众比率和偏度系数 (1) 用定义公式求方差和标准差标准差公式为:方差公式为:用定义公式求方差和标准差,首先要求离差(X -X),将离差平方再相加,然后除以N1. 方差与标准差方差是一种重要的离散量数,它的计算方法是,把一组数据中每个数据与该组算术平均数相减,将其差进行平方然后相加,再除以数据的个数。标准差是最重要、应用最广泛的离散量数。 1. 方差与标准差(2) 用原始数据计算方差和标准差

文档评论(0)

1亿VIP精品文档

相关文档