1统计学-数据的描述性例析.pptVIP

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
例. 在某地区抽取的120家企业按利润额进行分组,结果如表3.1所示. 表3.1 某地区120家企业的利润额分组 计算120家企业利润额的均值和标准差. ⑥离散系数(Coefficient of variation) 离散系数也称变异系数,是各变异指标与其算术平均数的比值.例如,将极差与其平均数对比,得到极差系数;将标准差与其平均数对比,得到标准差系数.最常用的变异系数是标准差系数: 标准差系数:标准差与其相应的均值之比,表示为百分数. 特点: 1、反映了相对于均值的相对离散程度; 2、可用于比较计量单位不同的数据的离散程度; 3、计量单位相同时,如果两组数据的均值相差悬殊,离散系数比标准差更有意义. 例子. 某管理局抽查了所属的8家企业,其产品销售数据如表3.2所示,试比较产品销售额和销售利润的离散程度. 销售额 销售利润 结论:计算结果表明, 说明产品销售额的离散程度小于销售利润的离散程度. 3.2.2 数据的标准化 ①定义 标准化数值是变量值与其平均数的离差除以标准差后的值,也称为z分数或标准分数.设标准化数值为z,则有: ●对于来自不同均值和标准差的个体的数据,往往不能直接对比.这就需要将它们转化为同一规格、尺度的数据后再比较. ●标准分数是对某一个值在一组数据中相对位置的度量. 例3.2.1 假定某班学生先后两次进行了难度不同的大学英语综合考试,第一次考试成绩的均值和标准差分别为80分和10分,而第二次考试成绩的均值和标准差分别为70分和7分.张三第一、二次考试的成绩分别为92分和80分,那么全班相比较而言,他哪一次考试的成绩更好呢? 解:由于两次考试成绩的均值和标准差不同,每个学生两次 考试的成绩不宜直接比较. 利用标准分数进行对比, 计算结果表明,第二次考试成绩更好些. ② 对称分布中的 法则 变量值落在 范围以外的情况极为少见.因此通常将落在区间 之外的数据称为离群点(或异常数据). 分布形状的描述 集中趋势和离散程度是数据分布的两个重要特征,但要全面了解数据分布的特点,还需要知道数据分布的形状是否对称、偏斜程度以及分布的扁平程度等.偏态和峰度就是对这些分布特征的进一步描述. 偏态和峰度是英国统计学家卡尔?皮尔逊首先提出的. 3.3.1 偏态(Skewness)及其测定 如果次数分布是完全对称的,叫对称分布;如果次数分布不是完全对称的,就称为偏态分布. ①所谓偏度,就是指次数分布的非对称程度,用偏态系数来表示. ②计算公式 式子中 称为偏态系数. 偏态系数有多种计算方法,在Excel软件中通常采用以下 公式: 当 时,左右完全对称,为正态分布;当 时为正偏(或右偏);当 时为负偏(或左偏). 偏态系数 的数值一般在0与±3之间,偏态系数越接近于0,分布的偏斜程度越小;偏态系数越接近于±3,分布的偏斜程度越大. 3.3.2 峰度(Kurtosis)及其测定 ①峰度是指变量的集中程度和次数分布曲线的陡峭(或平 坦)的程度. 在变量数列的分布特征中,常常以正态分布为标准,观察变量数列分布曲线顶峰的尖平程度,统计上称之为峰度. ②计算公式 式子中 称为峰度系数. 正态分布的峰度系数等于0,当 时为尖峰分布,表示次数分布比正态分布更集中;当 时为平峰分布,表示次数分布比正态分布更分散. 数据的描述性分析讨论题 1、任何平均数都受变量数列中的极端值的影响。 2、中位数把变量数列分成了两半,一半数值比他大,一半数值比他小。 3、任何变量数列都存在众数。 4、算术平均数、中位数和众数三者的数量关系说明什么样的变量分布特征? 5、什么是众数?有什么特点?试举例说明其应用。 6、极差越小说明数据的代表性越好,数据越稳定; 7、四分位差、平均差和标准差衡量的是哪个平均指标的代表性?上述三个指标哪些优越? 8、如果某同学在英语竞赛中的标准得分为2,并且知道1%为一等奖,5%为二等奖,10%为三等奖,则 则他( )。 A.获一等奖 B.获二等奖 C.获三等奖 D.无缘奖项 9、想知道某班同学统计学考试成绩的稳定性,需要用哪些指标比较好?相比较某班同学统计学考试成绩和大学英语考试成绩的稳定性,用哪些指标比较好? 10、在某地区抽取的120家企业按利润额进行分组, 结果如下表所示. 计算120家企业利润额的均值和标准差. 11、某管理局抽查了所属的8家企业,其产品销售数据

文档评论(0)

4477769 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档