- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
新编21世纪新闻传播学系列教材·新闻学系列;;市场调研数据分析;第一节数据分析的特点与性质;;;;;四、数据录入;;;;;1.算术平均数
算术平均数(arithmeticmean),又称均值,是统计学中最基本、最常用的一种平均指标,分为简单算术平均数、加权算术平均数。
(1)简单算术平均数
主要用于未分组的原始数据。设一组数据为x1,x2,...xn,简单的算术平均数的计算公式为:M=(x1+x2+…+xn)/n。;(2)加权算术平均数
当数据资料比较多,且已编制成变量数列的情况下,就要计算加权算术平均数。
公式为:
=(x1f1+x2f2+…+xnfn)/(f1+f2+…+fn)=xifi/fi
其中:f为权数,即变量在总体中出现的次数。;
;;2.中位数
中位数是指一组数据按大小顺序排列情况下处于中间位置上的数值。在测定中位数时,需先按照某一标志的特征依其高低、优劣、大小等顺序加以排列,然后确定其中心位置,并根据观察或计算出中位数。
中位数位置=(n+1)/2;3.众数
众数是指在数据中出现次数最多的一个数值。只有在总体单位数较多,且有明显集中趋势的资料中才能计算众数。;4.平均数、众数、中位数之间的关系
如果数列属于标准正态分布,不论哪个方向都没有偏态,平均数、众数和中位数则具有相同值。如果分布偏离中心或非对称,平均数一侧的值多于另一侧,平均数、众数和中位数具有不同的值。正偏态就是平均数以上的数值多于平均数以下;负偏态就是平均数以下的数值多于平均数以上的数值。;四、离散趋势;(二)测量指标
离散指标是用来测定总体各单位直接差异程度的统计指标,反应了变量值的离中趋势。离散指标主要测量指标包括极差、平均差、标准差。;1.极差(Range)
极差又称全距,是观测变量的最大取值与最小取值之间的离差,也就是观测变量的最大观测值与最小观测值之间的区间跨度。极差的计算公式为:
R=Max(xi)?Min(xi);2.均差(AverageDeviation)
均差是数列中各单位标志值对其算术平均数之间绝对离差的平均数,它反映了数列中相互差异的标志值的平均离散水平或差异程度。根据掌握的数据不同,均差有简单和加权两种计量形式。;简单均差(SimpleAverageDeviation)适用于未分组数据,其计算公式为:
;加权式均差(WeightedAverageDeviation)适用于分组数据,其计算公式为:
;3.标准差(StandardDeviation)
标准差是反映数据分布离散程度的最重要指标。
标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。;我们在数据分析中,一般是运算样本标准差(S)。样本标准差表示各样本值与其平均数离差平方的算术平均数的平方根。它反映一组数列中个体间的离散程度。;第三节双变量数据分析;二、列联表;三、三种常用的显著性差异检验方法;(二)分类变量与连续变量
1.分类变量
分类变量(categoricalvariable)是说明事物类别的一个名称,其取值是分类数据。
2.连续变量
在一定区间内可以任意取值的变量称为连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。例如,人体测量的身高、体重、胸围等为连续变量,其数值只能用测量或计量的方法取得。;(三)独立样本T检验
独立样本T检验的使用必须符合四个条件:
1.两组数据均来自正态分布的总体。
2.两组数据满足独立性。独立样本(independentsamples)是指,对一个样本内某变量的测定,不会影响到对另一样本内同一变量的测定结果。只要对一个总体中某变量的测定不会影响到另一个总体中同一变量的测定结果,就不需要进行两次调查。
3.满足方差齐性:两组数据与其均值的偏离程度基本相同
4.Y为连续变量;(四)方差分析
与t检验不同的是,x的组别可以是两组或多组。此外,方差分析的使用必须符合三个条件:
1.数据均来自正态分布的总体
2.满足方差齐性
3.Y为连续变量;(五)卡方检验
t检验与方差分析都要求Y为连续变量,可是我们知道,在市场调研的问卷调查中,Y为分类变量的情况其实更为常见,那么这时候就需要卡方检验。卡方检验必须满足两个条件:
1.R(行)×C(列)表中理论频数(又称为期望频数或期望计数)小于5的格子不能超过20%,如果超过20%,统计学认为这种卡方检验是有偏的,从而是无效的。
2.Y为分类变量;第四节相关分析;二、相关关系的种类;(二)按相关的形式分为线性相关和非线性相关
一种现象的一个数值和另一现象相应的数值在直角坐标系中确定为一个点,称为线性相关。如无此
文档评论(0)