网站大量收购独家精品文档,联系QQ:2885784924

[教育学]心理与教育统计学04.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[教育学]心理与教育统计学04

任何事物都没有真正正确的解释,解释是为人们理解而服务的一种媒介。解释的价值是使得他人可以更富有成果地思考。 Andreas Buja 第四章 数据离散程度的测度 (measures of dispersion) 数据分布的特征和测度 §4. 1 全距与百分位差 全距、极差 (range) 一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布 四分位距的概念 依一定顺序排列的一组数据中间部位50%个频数距离的一半作为差异量指标 也称为内距或四分间距 3、反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性 四分位距的计算方法 1、原始数据计算方法: 例如,25、22、29、12、40、15、14、39、37、31、33、19、17、20、35、30,求四分位距。 12、14、15、17、19、20、22、25、29、30、31、33、35、37、39、40 2、频数分布表计算法: 用内插法求出第一个四分位数及第三个四分位数,然后带入公式。 四分位距的应用及其优缺点 优点:四分位距简明易懂,计算简便,较少手两极端数值的影响,比全距可靠。 缺点:忽略了左右共50%数据的差异,不适合代数运算。 三、百分位距 百分位距是指两个百分位数之差。 计算方法 : §4.2 平均差、 一、平均差的概念 各变量值与其均值离差绝对值的平均数 能全面反映一组数据的离散程度 数学性质较差,实际中应用较少 二、平均差的计算方法 1、原始数据计算法: 例如,求原始数据78、83、69、75、97、88、86 的平均差。 2、频数分布表计算法; 平均差 (例题分析) 平均差 (例题分析) 三、平均差的优缺点 方差和标准差 (variance and standard deviation) 数据离散程度的最常用测度值 方差是指离差平方的算术平均数 反映了各变量值与均值的平均差异 根据总体数据计算的,称为总体方差(σ2)或标准差(σ);根据样本数据计算的,称为样本方差(s2)或标准差(s) 方差和标准差的计算方法 1、原始数据计算法 2、频数分布表计算法 样本方差和标准差 (simple variance and standard deviation) 样本标准差 (例题分析) 样本标准差 (例题分析) 方差和标准差的性质和意义 一组数据中每个数据都加或减去同一个数后,得到的方差等于原方差。 一组数据中每个数据都乘以一个数后,得到的方差等于原方差乘以这个数的平方。 方差与标准差是表示一组数据离散程度的最好指标。其值越大,说明频数分布的离散程度越大,该组数据较分散;其值越小,说明频数分布比较集中,离散程度小。 各种差异量的数值关系 R=6QX=7.5MD=9QD 差异系数 (coefficient of variation) 标准差与其相应的均值的百分比 CV,也称为变异系数。 对数据相对离散程度的测度。 消除了数据水平高低和计量单位的影响。 用于对不同组别数据离散程度的比较。 计算公式为: 差异系数的用途 1、比较不同单位资料的差异程度 2、比较单位相同而平均数相差较大的两组资料的差异程度 3、可判断特殊差异情况 差异系数 (例题分析) 差异系数 (例题分析) 经验法则与异常值的取舍 ?经验法则表明:当一组数据对称分布时 约有68%的数据在平均数加减1个标准差的范围之内 约有95%的数据在平均数加减2个标准差的范围之内 约有99%的数据在平均数加减3个标准差的范围之内 如果数据落在平均数加减3个标准差的范围之外,则在整理数据时,可将此数据作为异常值舍弃。 不同测度的选用 不同类型的数据可供选用的测度不同。 各种测度都有优缺点。 集中趋势的测度和离散程度的测度联合使用。 集中趋势的测度描述的频数分布的典型性,指的是一个点值,离散程度的测度反应频数分布的变异性,是一段距离。前者的代表性如何,可用后者的大小来说明。后者越小说明前者越有代表性。 §4.5 偏态量及峰态量 一、偏态量 1、利用算术平均数与众数或中位数的距离来计算 2、利用动差来计算: 二、峰态量 1、用两个百分位距来计算: 2、利用动差来计算: 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0 170 220 390 430 480 650 950 1000 1 2 3 4 5 6 7 8 销售利润(万元) x2 产品销售额(万元) x1 企业编号 某管理局所属8家企业的产品销售数据 【 例4.5 】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档