简明统计学3介绍.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3.5 相对位置的数字度量: 标准得分 标准得分/z值和标准化 经验法则(empirical rule): 对于正态分布, 大约68%的值分布在均值加减1s的范围中; 大约95%的值分布在均值加减2s的范围中; 大约99.7%的值分布在均值加减3s的范围中。 对于正态分布,大约68%的值会有一个-1~1之间的z值; 大约95%的值会有一个-2~2之间的z值; 大约99.7%的值会有一个-3~3之间的z值。 3.6 异常值(outlier) 不寻常的大或小的观测值。 可能是由于实验中的某种错误产生,也可能代表了稀有(偶然)事件。 对于正态分布,正负3S之外的观测值可粗略称为异常值。 对于盒型图,超过内限的值被认为是潜在的异常值,对于正态分布的数据,我们期望只有少于1%的观测值值落在内限之外。 作业 课后练习 统计学-3 Statistics 上章复习-内容概要 频数分布描述 频数分布表 直方图 茎叶图 频数折线图 累积频数折线图 Lorenz curve 概括和展示数据的方法   饼图 条形图/柱形图 线图 面积图 盒型图 散点图 对数图 其它 上章复习-作业 课后练习 3.1 引言 统计表、统计图、数字 定性变量主要用于计数,常用比例、百分比、频数等描述 定量变量一般用汇总统计量/概括统计量(summary statistic)来描述 3.2 集中趋势的数字度量 总体均值(population mean) 样本均值(sample mean)α修整均值 3.2 集中趋势的数字度量-均值 (mean) 算术平均数: 加权平均数: 例:某人射击十次,其中二次射中10环,一次射中9环,三次射中8环,四次射中7环,那么他平均射中的环数为: 8.1(环) 3.2 集中趋势的数字度量-均值 (mean) 例:学校随机抽取了100名学生,测量了他们的身高x(单位:cm),结果如表中所示: 身高范围(cm) 组中值 人数 130≤x140 135 4 140≤x150 145 11 150≤x160 155 31 160≤x170 165 46 170≤x180 175 8 则这100名学生的平均身高为: ? 当一组数据中存在一个或多个过大或过小的值时,可以用中位数来代表集中趋势, 中位数具有稳健性(robust)。 将数据从小到大排序,当数据个数为奇数时,中位数为(n+1)/2,当数据个数为偶数时,中位数为中间两个数的平均值。如:80,81、85,0 定性数据也可以计算中位数。(定序水平的数据) 3.2 集中趋势的数字度量-中位数(median) 众数是数据中重复出现次数最多的数 :如对某一品牌的态度,或一班人体育课后的心率。 众数可以代表大多数,但并非所有数据集合都有众数,其次有些情况下可能存在多个众数。因此,众数比均值和中位数应用得相对较少。 3.2 集中趋势的数字度量-众数(mode) 3.2 集中趋势的数字度量-相对位置 3.3 离散程度(变异性)的数字度量 例:A班和B班英语测试平均分均为74分,要在一个班里随机选取一位搭档去参加英语竞赛,应该在哪个班选? 描述离散程度的统计量称为尺度统计量(scale statistics)/散度统计量,包括: 极差、四分位数间距、平均差、方差、标准差、标准误、变异系数。 3.3 离散程度(变异性)的数字度量 3.3.1 极差(range)和四分位数间距/极(IQR) 仅考虑两个极端值,比较粗糙。两个数据集可以拥有相同的极差,但数据内部的变化上却可以非常不同。 3.3.2 平均差(MD)、方差(Variance)和标准差(standard deviation) =0 标准差最小值为0 3.3.3.1 切比雪夫定理(Chebyshev’s theorem) 无论何种分布, 至少3/4(75%)的值分布在均值加减2s的范围中; 至少8/9(88.9%)的值分布在均值加减3s的范围中; 至少24/25(96%)的值分布在均值加减5s的范围中。 至少1-1/k2的值分布在均值加减ks的范围中,k是任一大于1的数。 3.3.3.2 经验法则(empirical rule) 对于钟形分布, 大约68%的值分布在均值加减1s的范围中; 大约95%的值分布在均值加减2s的范围中; 大约99.7%的值分布在均值加减3s的范围中。 对于钟形分布,全部观测值基本都在均值加减3s的范围中,即R=6s,如果知道极差R,则可算出s=R/6. 例:钟形,s=10←→R=60。 3.3.4

文档评论(0)

金不换 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档