网站大量收购独家精品文档,联系QQ:2885784924

也就是变量值的合并.PPT

  1. 1、本文档共115页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
也就是变量值的合并

* 通过基本统计方法的学习,可以对要分析数据的总体特征有比较准确的把握,从而有助于选择其他更为深入的统计分析方法 * 在正态或近似正态分布的计量资料中,经常在使用上一节统计描述过程分析后,还要进行组与组之间平均水平的比较 * 1.1 均值(Mean)和均值标准误差(S.E.mean) 1.1.1 统计学上的定义 定义:均值(平均值、平均数)表示的是某变量所有取值的集中趋势或平均水平。例如,学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。 计算公式如下。 样本数据来自总体。样本的统计描述量可以反映总体数据的特征,但由于抽样等原因,使得样本数据不一定能够完全准确地反映总体,它可能与总体的真实值之间存在一定的差异。进行不同次抽样,会得到若干个不同的样本均值,它们与总体均值存在着不同的差异。 均值标准误差(Standard Error of Mean,S.E. mean)就是描述这些样本均值与总体均值之间平均差异程度的统计量。 均值标准误差(S.E.mean) 1.2 中位数(Median) 1.2.1 统计学上的定义 定义:把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。它是一种位置代表值,所以不会受到极端数值的影响,具有较高的稳健性。 1.3 众数(Mode) 1.3.1 统计学上的定义 定义:众数是指一组数据中,出现次数最多的那个变量值。众数在描述数据集中趋势方面有一定的意义。例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。 计算公式:手工计算众数比较麻烦,需要统计数据的次数分布。 1.4.1 统计学上的定义 1.4 全距(Range) 定义:全距也称为极差,是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。 计算公式:最大值-最小值。 1.5.1 统计学上的定义 1.5 方差(Variance)和标准差(Standard Deviation) 定义:方差是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的离散趋势越大。 ? 研究问题 已知某零件的平均长度为a,现用甲、乙两台仪器各测量10次,将测量结果X用坐标上的点表示如图: 机器甲 机器乙 1.6 四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles) 1.6.1 统计学上的定义 定义:四分位数是将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差,记为Q。四分位差越小,说明中间的数据越集中;四分位数越大,则意味着中间部分的数据越分散。 1.7 频数(Frequency) 1.7.1 统计学上的定义 定义:频数就是一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个人,这就需要用到频数分析。 1.8 峰度(Kurtosis) 1.8.1 统计学上的定义 定义:峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。 1.9 偏度(Skewness) 1.9.1 统计学上的定义 定义:它是描述某变量取值分布对称性的统计量。 偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;偏度小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。 案例:描述性统计分析 频数分析 基本描述统计量 交叉分组下的频数分析 多项选择题的分析 2012-2-15 Means过程 2.1 单一样本T检验 2.2 两独立样本T检验 2.3 两配对样本T检验 2.4 2、 均值比较和T检验 2.1 Means过程 2.1.1 统计学上的定义 定义:Means过程其实就是按照用户指定条件,对样本进行分组计算均数和标准差,如按性别计算各组的均数和标准差。 例如:比较不同性别同学的数学成绩平均值和方差。 2.2 单一样本T检验 2.2.1

您可能关注的文档

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档