统计学-数据的描述性分析幻灯片.pptVIP

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
正态分布的峰度系数等于0,当 时为尖峰分布,表示次数分布比正态分布更集中;当 时为平峰分布,表示次数分布比正态分布更分散. 数据的描述性分析讨论题 1、任何平均数都受变量数列中的极端值的影响。 2、中位数把变量数列分成了两半,一半数值比他大,一半数值比他小。 3、任何变量数列都存在众数。 4、算术平均数、中位数和众数三者的数量关系说明什么样的变量分布特征? 5、什么是众数?有什么特点?试举例说明其应用。 6、极差越小说明数据的代表性越好,数据越稳定; 7、四分位差、平均差和标准差衡量的是哪个平均指标的代表性?上述三个指标哪些优越? 8、如果某同学在英语竞赛中的标准得分为2,并且知道1%为一等奖,5%为二等奖,10%为三等奖,则 则他( )。 A.获一等奖 B.获二等奖 C.获三等奖 D.无缘奖项 9、想知道某班同学统计学考试成绩的稳定性,需要用哪些指标比较好?相比较某班同学统计学考试成绩和大学英语考试成绩的稳定性,用哪些指标比较好? 10、在某地区抽取的120家企业按利润额进行分组, 结果如下表所示. 计算120家企业利润额的均值和标准差. 11、某管理局抽查了所属的8家企业,其产品销售数据如 下表所示,试比较产品销售额和销售利润的离散程度. 12、假定某班学生先后两次进行了难度不同的大学英语 综合考试,第一次考试成绩的均值和标准差分别为80分和 10分,而第二次考试成绩的均值和标准差分别为70分和7 分.张三第一、二次考试的成绩分别为92分和80分,那么 全班相比较而言,他哪一次考试的成绩更好呢? * 案例2:乙班《统计学》考试情况如下表: 60分以下 2 60-70 30 70-80 8 80-90 4 90分以上 1 案例3:丙班《统计学》考试情况如下表: 60分以下 2 60-70 5 70-80 12 80-90 25 90分以上 7 问题 1、计算甲、乙、丙三个班的平均成绩;该平均值是真实值还是近似值?如是近似值,什么情况下会是真实值? 2、计算甲、乙、丙三个班的中位数、众数; 3、如要选择从算术平均数、中位数和众数三个平均数中选择一个数来分别代表甲、乙、丙三个班的整体水平,请问你会选择哪个平均数?为什么? 4、如要分别反映甲、乙、丙三个班的考试情况,你会选择用哪些指标来衡量? 5、如要比较甲、乙、丙三个班的考试情况的优劣,你又会选择什么样的指标来衡量? 6、甲乙丙三个班的考试成绩分别服从对称分布、左 偏分布、右偏分布中的哪种分布?为什么? 先计算各组的累计次数,再按公式 确定 中位数的位置,并对照累计次数确定中位数。 由组距数列确定中位数 下限公式: 为中位数组的下限; 为总次数; 为中位数组前一组的向上累计次数; 为中位数组的次数; 为中位数组的组距。 组距式变量数列计算众数的公式: 离散程度的描述 ●反映各变量值远离其中心值的程度(离散程度),从另一个侧面说明了集中趋势测度值的代表程度. 3.2.1 离散程度的常用指标 ①异众比率 式中, 为变量值的总频数; 为众数组的频数. 异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性越差. ②全距(极差) 极差(Range)也叫全距,是一组数据的最大值与最小值之差,即: 组距分组数据可用最高组上限-最低组下限计算. ③四分位差 四分位差(quartile deviation)也称内距或四分间距(inter-quartile range),是指第三四分位数和第一四分位数之差. 四分位差的计算公式为: 把所有数据由小到大排列并分成若干等份,处于分割点位 置的数值就是分位数. 把所有数据由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数. 分位数可以反映数据分布的相对位置(而不单单是中心位置). 常用的有四分位数、十分位数、百分位数. 四分位数(Quartile): Q1 ,Q2 ,Q3; 十分位数(Decile): D1 , D2 ,..., D9; 百分位数(Percentile): P1, P2 ,...,P99 ; 四分位数的计算 首先确定四分位数的位置,再找出对应位置的标志值即为 四分位数.设样本容量为n,则 如果各位置计算出来的结果恰好是整数,这时各位置上的 标志值即为相应的四分位数;如果四分位数的位置不是整 数,则四分位数为前后两个数的加权算术平均数.权数的大 小取决于两个整数位置与四分位数位置距离的远近,距离 越近,权数越大. 在实际应用中,计算四分位数的方法并不统一(数据量大时 这些方法差别不大),对于一组排序后的数据:

文档评论(0)

mkt361 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档