市场调查与预测-吕亚荣-第11章 描述统计方法.pptxVIP

市场调查与预测-吕亚荣-第11章 描述统计方法.pptx

  1. 1、本文档共73页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第11章 描述统计方法;学习目标:;11.1 单变量数据的基础描述指标;(2)比例。 比例是指总体中各类别的频数分别占总频数的比重,通常用来反映总体的构成,反映的是部分与总体之间的关系。将计算出的比例乘以100%,可得百分比。 (3)比率。 比率是指总体中各个类别之间的频数比值,反映的是总体中部分与部分之间的关系。比率也可以用来反映同一现象在不同时间或空间上的数量关系。 ;11.1.2 定序数据 定序数据本身是对现象特征在有序分类基础上的数字表达。定序数据具有定类数据的特点,但是强调分类的前后位置和排列顺序。 (1)累积频数。 累积频数方法是把总体中各类别的频数依顺序逐级累加起来的方法。从类别顺序开始的位置依次向后进行累加,称为向上累积;从类别顺序最后的位 置依次向前进行累加,称为向下累积。该方法反映某一类别以上或某一类别以下的频数之和。 (2)累积频数百分比。 累积频数百分比方法是将各类别频数占总频数的百分比逐级累加起来的方法。在计算市场集中度的方法中,经常使用的洛伦兹曲线就是应用累积频数百分比方法绘制累积频数分布图的典型。;11.1.3 定距和定比数据 定距和定比数据的数学特性高于定类和定序数据,用来描述定类和定序数据的方法皆适用于定距和定比数据。 (1)单变量值分组。 单变量值分组是把每一个变量值单独作为一组。一个数值即是一组,变量值相同的, 视为一组;相同变量值的个数,即是这个变量值的频数。 (2)组距分组。 组距分组是将全部变量值划分为若干区间,每一个区间的变量值即为一组的分组方法。该方法适用于连续变量或变量值比较多的情况。在组距分组中,每一组的最小值称为下限 (lower limit),每一组的最大值称为上限(upper limit)。组距分组需要确定组数、 组距和组限等。 ; 分组步骤。 一是确定组数。组数的确定是为了观察数据分布特征的需要。组数的确定既要参考已有经验,也要结合数据的特点和多少。 在实际分组时,也可以按斯特奇斯(Sturges)提出的经验公式来确定组数K,作为确定组数的参考。 其中,n为数据的个数;组数K采用???舍五入的方法取整数。;二是确定组距。 在进行组距分组时,一定要遵循 “不重不漏”的原则,既不能有数据被漏掉,也不能 有重复出现的数据。为此,在统计分组时,为了避免重复,按照惯例 “上组限不在内”原 则,当相邻两组的上限和下限重叠时,与上限值和下限值相同的数据,要自动归入下限值所在的组内。如果数据是离散的,那么数据本身就是间断的,分组时相邻两组的组限可以 采用间断、不重复的方法解决问题;如果数据是连续的,那么分组时相邻两组的组限可以 相同、重叠,此时可以遵照 “上组限不在内”原则解决可能产生的重复问题。 ;;;● 组中值。 组距分组只是对数据的整体情况进行了描述,但是对于组内数据的分布状况没有反映,为此可以采用组中值作为各个分组数据的代表值。 ;11.2 单变量数据集中趋势的度量指标;;;● 根据分组数据确定中位数。 步骤如下: ①确定中位数的位置。 ②确定中位数所在的组。在向上累积的频数分布中找到“中位数的位置”所在的组, 这就是中位数组。 ③确定中位数的值。由于中位数组是一个区间,可用如下公式计算中位数的近似值: ;;● 根据未分组数据确定四分位数。 步骤如下: ①对数据进行排序。 ②确定四分位数的位置。 ③确定四分位数的值。 当四分位数的位置在某一个具体数值上时,这个值就是分位数值; 当四分位数的位置不在某一个具体数值上时,需要按照四分位数的位置,按比例分摊四分位数位置两侧数值的差值。;● 根据分组数据确定四分位数。 步骤如下: ①确定下分位数QL和上分位数QU的位置。 ②确定下分位数QL和上分位数QU所在的组。 在向上累积的频数分布中找到 “四分位数的位置”所在的组,这就是四分位数所在的组。 ;;;11.2.3 均值 均值是指算数平均数 ,是全部数据加总后除以数据个数而得到的值。均值在统计学中具有重要地位,是数据集中趋势的最主要度量指标。 算数平均数的计算方法主要适用于数学特性强的定距数据和定比数据,不适用于定类数据和定序数据。 (1)未分组数据的算数平均数的计算方法。 ;(2)分组数据的算数平均数的计算方法。;11.2.4 众数、中位数和均值的关系 众数、中位数和均值是集中趋势的主要度量指标,具有不同的特点和适用性。 对于具有单峰分布的数据而言,众数 是一组数据中频数最多的变量值,一定位于数据单峰分布中的最高峰; 中位数 是处于一组数据中间位置上的值; 均值 则是全部数 据的算数平均值。 根据数据分布的特征,众数、中位数和平均数的关系见图11.1。 如果数据分布是对称的,那么众数、中位数、均值三者相等,即 如果数据分布是左偏的,说明数据存在极

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档