应用2统计量的计算及箱线图.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语言研究中的统计学 LOGO 语言研究中的统计学 语言研究中的统计学 (Ⅱ) 2009 年 3 月 山西大学数学科学学院 * 语言研究中的统计学 基本统计量 语言研究中的统计学 * 山西大学数学科学学院 (一)平均数(样本均值) 语言研究中的统计学 * 山西大学数学科学学院 1、算术平均 根据频数分布表? 根据分组频数分布表? 2、加权平均 加权平均数例子 语言研究中的统计学 * 山西大学数学科学学院 例1 有3个班,人数分别为20、30和40,在某次考试中的平均成绩分别为85,75,80,那么这三个班的加权总平均成绩为: 例2 综合测评成绩的计算: 注意:权大小的确定要有一定的依据。 特别地:如果所有权的和为1,则称为标准权。 (二)中位数 语言研究中的统计学 * 山西大学数学科学学院 顺序样本中间位置的数, 即样本容量(总次数)N的50%位置的数。 1、对未分组数据求中位数 2、根据分组频数分布表求中位数 或 L —中位数所在组下限 U —中位数所在组上限 fL —L以下各组总次数 fU —U以上各组总次数 F —中数所在组次数 i —中数所在组组距 (三)众数 语言研究中的统计学 * 山西大学数学科学学院 一组数据中出现次数最多的数值 注意: 1、如组中各数都相同,则没有众数; 2、也可能出现两个以上的众数; 3、称含有两个众数的次数分布为双众数分布。 求法: 从顺序样本中找,样本容量大的,先做频数统计表。 平均数、中位数和众数的关系 * 皮尔逊经验公式(P40) 众数=3*中位数-2*平均数 山西大学数学科学学院 语言研究中的统计学 平均数、中位数和众数的比较 语言研究中的统计学 * 山西大学数学科学学院 1、灵敏度 平均数的计算涉及到每个样本值,所以对数值的变化比较敏感。 2、稳定性 对同一总体而言,均值比较稳定,受抽样影响较小。 3、信息量 平均数既反映了数值的顺序关系,又体现了所有样本的值,同时又稳定,所以它所提供的信息量最大。 4、运算 平均数适合代数运算,且比较简单。 平均数、中位数和众数的比较 语言研究中的统计学 * 山西大学数学科学学院 6、极端值 样本中过大或过小的数值称为极值 平均值不能体现极端值的信息,从而不能很好地反映分布的信息,有时中数和众数更好一点。 7、数据分布 对于对称分布,三数非常接近,特别是正态分布时三数相等; 对偏态分布,三数差异较大,一般地: 正偏或右偏时,众数中位数平均数 负偏或左偏时,平均数中位数众数 平均数、中位数和众数的比较 语言研究中的统计学 * 山西大学数学科学学院 三数各有优缺点,平均数用得比较多。 正态分布,三数相同 正偏或右偏 众数中位数平均数 负偏或左偏 平均数中位数众数 语言研究中的统计学 * 山西大学数学科学学院 (四)极差 极差又称两极差,是样本值中最大值和最小值之间的差。 Xmax Q1 Q2 Q3 Xmin 两极差 25% 25% 语言研究中的统计学 * 山西大学数学科学学院 (五)四分差 定义: 分组数据四分点的求法: 语言研究中的统计学 * 山西大学数学科学学院 (六)(绝对)平均差(AD) 定义: 分组数据平均差的求法: 注意到: 所以我们需要取绝对值。 其中称右式为离均差: 语言研究中的统计学 * 山西大学数学科学学院 (七)方差与标准差 未分组数据: 变形一 变形二 由次数分布表来求更简单一些。略 语言研究中的统计学 * 山西大学数学科学学院 (七)方差与标准差(续) 由分组次数分布表: 式中: f为组频数; d为各组数据的假定平均离均差, 其中Xc为各组组中值,A为估计平均值。 N为总次数,i为组距。 A的确定:取总次数一半的累积次数所对应的那一组的组中值,因为它更接近真正的平均值。 语言研究中的统计学 * 山西大学数学科学学院 离中趋势量的比较 极差可以在一定程度上反映数据的差异情况,为数据分组提供依据; 四分差比两级差稳定可靠,常与中位数结合使用; 平均差优于两级差和四分差,用数值离开平均值的平均距离来反映数据的离散程度,但不适合微分运算; 方差和标准差是最理想的差异量:概念易于理解,适合代数运算和微分运算,能反映所有数据的差异情况,不易受抽样的影响。 一个分数在一组分数中的位置是参照该组分数的典型分数来确定的,也就是说,一个分数可以描述为在典型分之上还是之下或者是等于典型分,以及它离开典型分有多远。这个典型分数用平均分表示,离开典型分的距离用标准差表示,这样我们就可以是“某个分数离开平均分多少个标准差单位”,同时用正负号表示该分数处于平均分之上还是之下。 这实际上就是把原始分数转换为标准差单位数,或以标准差为单位来表示一个分数与平均数的差,此过程称为标准化过程 语言

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档