第四讲 描述统计.ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四讲 数据分析:描述统计 数据分析 描述统计 如何使用一些统计指标来描述数据的特征 推论统计 如何从样本的统计指标来推知总体的统计指标 描述统计的基本概念 中心位置:中心位置被用来度量一组数据的集中趋势,描述这组数据分布的中心。对其数量化描述称为集中量数。集中量数可以作为这批数据一般水平的代表值。 离散性:离散性被用来反映一组数据的分散程度,即频次分布的离散程度。对其数量化描述称为差异量数。差异量数可以描述这批数据分布的形态。 相互关系:描述两个变量之间的关系密切程度,对其数量化的描述称为相关系数 描述统计的基本概念 中心位置:反映一组数据的集中趋势。 中心位置的量化描述:集中量数 算术平均数 几何平均数 中位数 众数 …… 算术平均数、众数和中数的关系 当频率分布呈对称时三者合为一点 当频数分布呈偏态时,三者存在差异 分布呈向左偏时, MdMo 分布呈向右偏时, MdMo 数据离散性的量化指标:差异量数 全距 平均差 方差和标准差 …… 一、全距 全距也叫两级差,就是最大值与最小值之间的距离,用R表示 二、平均差 平均差就是每个数与平均数的差的绝对值的算术平均值,用AD表示 集中量数与差异量数的联系 下面的数据表示三个射击手的射击成绩 A:7 7 8 8 8 9 9 B:4 5 7 8 9 11 12 C:1 4 7 8 9 12 15 集中量数与差异量数的联系 方差和标准差是最常用的差异量数 与算术平均数配合使用 计算其他统计量如差异系数、相关系数、标准分数时要用到 在推断统计分析中,常用方差表示数据的离散程度 方差和标准差的应用 差异系数 标准分数 一、差异系数 差异系数的用途:当两个或多组数据所表示的特质不同,使用的观测工具不同时,可以用差异系数来比较其离散程度的大小 例子:学生的体重和身高 CV体重 = CV身高= 二、标准分数 定义:标准分数又称为Z分数,是以标准差为单位表示一个数在数组中所处位置的相对量数 计算公式 二、标准分数 标准分数的性质 ①一组数据中所有由原分数转换得出的标准分数的和为零,平均数也为零 ②一组数据中标准分数的标准差为1 标准分数的应用 可用于比较分数性质不同的观测值在各自数据分布中的相对位置高低 例子:谁的成绩更好 作业04-01 描述统计的基本概念 相关关系:两类现象(两个变量)在发展变化的方向与大小方面存在一定的关系,但不能确定这两类现象(两个变量)之间哪个是因,哪个是果。例如,同一组学生的物理成绩与数学成绩的关系,同一群人的身高和体重的关系,都属于相关关系。 用散点图来表示相关关系 用散点图来表示相关关系 用散点图来表示相关关系 用散点图来表示相关关系 用散点图来表示相关关系 描述统计的基本概念 线性相关系数计算 皮尔逊积差相关 斯皮尔曼等级相关 皮尔逊积差相关 适用条件 连续变量,即等距或比率变量 计算公式 斯皮尔曼等级相关 适用条件 等级变量 计算公式 作业 再 见! 身高 体重 身高 体重 身高 体重 身高 体重 身高 体重 身高 体重 身高 体重 线性相关 非线性相关 相关系数:两个现象(两变量)之间相关密切程度的量化指标,常用字母r表示。相关系数的取值范围为[-1,1],绝对值越大,则两者的相关关系越密切 当r 0时,则两个变量之间存在正相关关系 当r = 0时,则两个变量之间不存在相关关系 当r 0时,则两个变量之间存在负相关关系 45 52 49 50 53 50 44 47 45 50 weight 165 180 183 178 188 173 155 160 173 170 high 10 9 8 7 6 5 4 3 2 1 Num. 例子:学习成绩与课堂纪律的相关系数(N = 10) 学习 1 2 3 4 5 6 7 8 9 10 纪律 1 4 3 2 9 5 6 8 10 7 D 0 -2 0 2 -4 1 1 0 -1 3 D为等级差,N为数据对数 * 低分 高分 A校中心位置 B校中心位置 C校中心位置 例子:A,B和C三个学校高考成绩的分布曲线 算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数,用 表示。 一、算术平均数(Mean) 二、几何平均数

文档评论(0)

wxc6688 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档