- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
5.4 方差和标准差 样本方差公式: 样本标准差公式: 当样本较大时,由于 几乎等于 ,因此常用公式 代替公式 来计算样本标准差S,并用于估计总体标准差 。 5.4 方差和标准差 在小样本情况下, 是较 为总体标准差 的更优良的估计量 。 5.5 离散系数 标准差是反映数据差异水平的绝对值,其数值的大小受原始数据水平高低的影响,数据的观测值越大,标准差的值自然也就越大。 当进行两个或多个数据集变异程度的比较时,如果均值相同,可以直接利用标准差来比较。但是如果均值不同时,比较其变异程度就不能采用标准差了。 5.5 离散系数 离散系数(coefficient of variation),又称变异系数,记为CV,计算公式为 一般的,如果数据具有以下特点之一,就可以使用离散系数: 数据具有不同的单位(比如工资和矿工的天数) 数据具有相同的单位,但是均值相差甚远(比如大象和老鼠的体重) 5.5 离散系数 例:某学校学生平均年龄为20岁,标准差为3岁;该校教师平均年龄为38岁,标准差为3 岁。比较该校学生年龄和教师年龄的离散程度,则( ) A.学生年龄和教师年龄的离散程度相同 B.教师年龄的离散程度大一些 C.教师年龄的离散程度是学生年龄离散程度的1.9倍 D.学生年龄的离散程度大一些 5.6 偏度和峰度 偏度是用来反映变量数列分布偏斜程度的指标。 变量数列的 单峰钟形分布 对称分布 非对称分布 (偏态分布) 右偏分布 (正偏分布) 左偏分布 (负偏分布) 5.6 偏度和峰度 右偏分布 左偏分布 5.6 偏度和峰度 用偏度系数可以准确地测定分布的偏斜程度和进行比较分析。 Pearson偏度系数(SK): SK为无量纲的系数,通常取值在-3~+3之间。绝对值越大,说明分布的倾斜程度越大。 SK = 0:对称分布 SK 0:右偏分布 SK 0:左偏分布 5.6 偏度和峰度 峰度是用来反映变量数列曲线顶端尖峭或扁平程度的指标。 一般来说,峰度系数β=3,分布为正态峰度,当峰度系数β3时,表示频数分布比正态分布更集中,分布呈尖峰状态,β3时表示频数分布比正态分布更分散,分布呈平坦峰。 Ⅱ(β3) Ⅰ(β=3) Ⅲ (β3) dongchengjie@163.com * 众数一般用来描述分类变量,特别是那些有许多个值的分类变量。 * 当一个变量有两个众数时,这个变量的观测值常常是由来自两个群体的数据混合组成的。例如一个班级中学生的身高的直方图就可能是二众分布,因为这些学生中有男生也有女生。 * * * 一个由100人组成的群体,无论它有51个女人(和49个男人)或者99个女人(和1个男人),其性别变量的众数都是女人。这两种情况是非常不同的,但是众数并不能区分它们。 * 一般来说,房价和许多其它的经济变量常常是用中位数(median)来描的,因为价格是一个度量变量且有较高和较低之分。不像分类变量,价格的值可以从小到大排序,排序后其中间值即是中位数的值。当房价的中位数是每平方米10000元时,一半的房价低于这个数另一半房价高于这个数。在这个例子中,中位数与其它房子的价格没有关系。 * 何时使用中位数呢? 当一个数据的直方图显示出是非对称或非正态分布时,我们常常使用中位数,尤其是房价和收入数据。 房子的价格数据就是一个典型的非对称分布。大部分房子的价格在中间部位,但通常也有几个房子的价格特别高,于是直方图的右侧有一个尾巴。 职工的收入数据也是一个典型的非对称分布。 * 例如,在若干个连锁店间选择仓库或商品配送中心就可以利用这一性质,因而在工程设计中有应用价值。 * 只有当标志总量表现为各个标志值的连乘积时,才适合采用几何平均数方法来计算平均标志值。 * 如果分布的偏斜程度很高,均值将不能作为一个很好的度量。相对而言,中位数和众数的代表性更强。 * 假设有一群大象和一群小老鼠,现在想知道大象家族的体重差异大还是老鼠家族的体重大?显然,大象的体重远远高于老鼠,此时要比较各自体重差异就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。 * dongchengjie@163.com 内容 众数 平均数 中位数 分位数 均值…… 集中趋势 极差 方差 标准差 离散系数…… 离散趋势 1、众数 样本中出现最多的数目,称为众数(mode)。 50次购买软饮料的频数 某企业工人按日产量分组 日产量
您可能关注的文档
最近下载
- 化验室组织与管理课件 第四章 化验室检验系统及管理.pptx VIP
- 教师去极端思想心得体会.docx VIP
- 纳米材料科技前沿:CeO基材料热控特性的调控机制研究.docx VIP
- 热点11数列的通项公式及求和(8题型 高分技法 限时提升练)-2025年高考数学 热点 重点 难点 专练(北京专用)(原卷版).docx VIP
- 歙县新安小学网络意识形态安全管理制度.doc VIP
- 标准图集-14K117-1_3 金属风帽及附件 (2014年合订本).pdf VIP
- 2025年高考数学专练(新高考通用)热点1-2 不等式与复数(8题型+高分技法+限时提升练)(原卷版).docx VIP
- 施工组织设计毕业设计正文.doc VIP
- 烧伤手术.ppt.ppt VIP
- 医学分析-(口腔颌面外科)颌骨骨髓炎.pptx VIP
文档评论(0)