大学应用统计学经典课件04——数据分布特征测度.ppt

大学应用统计学经典课件04——数据分布特征测度.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
应用统计学-4 描述统计学在沉积学的一些应用 非众数组的频数占总频数的比率,称为异众比率(variation ratio),用Vr表示。 定义4.8 定义4.7 定义4.9 上四分位数与下四分位数之差,称为四分位差(quartile deviation),也称为内距或四分间距(inter-quartile range),用Qd表示。 一组数据的最大值与最小值之差,称为极差(range),也称全距,用R表示。 定义4.10 各变量值与其均值离差绝对值(之和)的平均数,称为平均差(mean deviation),也称平均离差,用Md表示。 定义4.11 各变量值与其均值离差平方和的平均数,称为方差(variance)。 定义4.12 方差的平方根,称为标准差(standard deviation)。 定义4.13 变量值与其平均数的离差除以标准差后的值,称为标准分数(standard score) ,也称标准化值或 z 分数。 一组数据的标准差与其相应的均值之比,称为离散系数(coefficient of variation),也称变异系数。 定义4.14 变量值总频数 众数组频数 什么是非众数? 异重比越大, 代表性越差! 四分位差相差2个等级,中位数“一般”两侧共有50%的家庭在“满意”和“不满意”之间。 如果:QL=不满意;QU=一般 QD=3-2≠2 注意:与标准差或方差对比 注意:平均差有量纲! 注意:标准差也有量纲! 标准差可以有单位 为何用总体计算时自由度为N? 与平均差有何区别? 平均值的方差多出的部分 均值=34 标准差=6 均值=0 标准差=1 标准差 均值 68%的数据在此范围内 例4.15有几个家庭落在平均数加减2个标准差范围内? 2个标准差 均值 75%的数据在此范围内 什么是异常值与离群点? 均值 异常点 异常点 3个标准差 3个标准差 (300+1)/4 =72.25 3*(300+1)/4 =225.75 搞清楚四分位数的值与四分位数的位置的区别 0.75 21 23 1 2 1.75 0.25 28 30 5 6 5.25 3 Q所在组的下限值 Q所在组以前各组的累积频数 Q所在组的组距 Q所在组的频数 数据个数 3 (50+1)/4 3*(50+1)/4 P78 (未分组数据) (已分组数据) 权(频数) 组中值 ? 单变量或未分组数据 分组数据 尝试计算这两组数据的众数和中值 例:科目成绩与学分。 这样的性质表明均值是集中趋势最好的代表值(数据中心) 把均值(X)换成中值(Me)看看! 权(频数) 组中值 已知资料 总成交额 = 总成交量 平均价格 已知资料 平均价格=? 成交额 = 成交量 价格 ∑XiFi/Xi 成交额 = 成交量 价格 成交额 = 成交量 价格 成交额 = 成交量 价格 全部成交额 = 平均价格 全部成交量 ∑ 单项成交量 全部成交量 = 全部成交额 = 平均价格 单项批发价格 单项成交额 ∑ 单项批发价格 单项成交额 = 单项成交量 成交额 = 成交量 价格 ∑XiFi/Xi 数据中出现“0”值时不宜计算调和平均数 几何平均值 这是平均增长率吗? 2000年产量=100+100X9%=100(1+9%) 2001年产量= 2000年产量+ 2000年产量X16%= 2000年产量(1+16%) 2002年产量= 2001年产量+ 2001年产量X20%= 2001年产量(1+20%) 2002年产量= 100 (1+9%)(1+16%)(1+20%) 2002年产量= 100 (1+G1)(1+G2)(1+G3) 100(1+9%) 100(1+9%)(1+16%) 假设:G1=G2=G3 2002年产量= 100 (1+G)3 = 100 ∏(1+G) 3 只适合于定比数据,对于定距数据不宜使用。 这是平均增长率吗? 平均收益率=103.84%-100%=3.84% 平均发展速度 平均增长率=平均发展速度 - 1 Me Mo X Me Mo X Me Mo X = = (例:99个女生和1个男生; 51个女生和49个男生) 什么叫“不受极端值影响”? 众数 什么叫“左偏”和“右偏”? 中位数 服装尺寸、商品价格水平、判别抄袭 中间收入、房价 有极端值存在时,不宜用均值。 标准分数 * 集中在某个位置 标准分数 标准分数 定义4.1 一组数据中出现次数最多的变量值,称为众数(mode),用M0表示。 定义4.2 一组数据排序后,处于中间位置的变量值,称为中位数(median),用Me表示。 定义4.3 一组数据排序后处于25%和75%位置上的值,称为四分位数,也称四分点。 定义4.4 一组数据相加后除以数据的个数而得的结果,称为均值(mean

文档评论(0)

nnh91 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档