数据、模型与决策第三、四章.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 参数样本推断 参数样本推断 统计量与抽样分布 参数估计的应用 假设检验应用 总体 选择个体 样本 观测样本 样本观察值 (数据) 数据处理 样本有关结论 推断总体性质 统计量 统计的一般步骤 这种不含任何未知参数的样本的函数称为统计量. 它是完全由样本决定的量. 第四章 参数样本推断 第一节 统计量与抽样分布 统计量 X1,X2,…,Xn为来自总体X的样本,称不含未知参数的样本的函数f(X1,X2,…,Xn)为统计量.若x1,x2,...,xn为样本观测值,则称f(x1,x2,...,xn)为统计量f(X1,X2,…,Xn)的观测值. 统计量是处理、分析数据的主要工具.对统计量的一个最基本的要求就是可以将样本观测值代入进行计算,因而不能含有任何未知的参数. 设X1,X2,…,Xn是来自总体X的样本,X~N(?,? 2),其中? 、? 2为未知参数,则X1, , min{ X1,X2,…,Xn },为统计量 。但诸如 等均不是统计量,因它含有未知参数? 或?. 1 第一节 图表描述分析 2 第二节 数量资料的特征数字 3 第三节 属性资料的特征数字 Contents ? 第三章 统计资料描述分析 第一节 图表描述分析 图表描述分析 统计表的种类与应用 频数分布的编制 统计资料的图像描述 单变量的频数分布 两变量交叉分类的频数分布 直方图、折线图与曲线图 累积分布图 饼形图与圆环图 帕累图 散点图 雷达图 茎叶图 第二节 数量资料的特征数字 集中趋势 离散趋势 相关性测量 软件应用 原始数据: 10 5 9 13 6 8 集中趋势 算术平均数: 含义:假定 为样本观察值,用 表示算术平均数,则算术平均数的基本计算公式为 特殊考虑:对于已经过分组并形成频数分布的资料,此时计算算术平均数就要采用加权的办法。计算加权算术平均数时,需要对各个组的变量值与相应组的频数的乘积求和,然后除以频数之和 加权均值 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组: 考试成绩(X ): 0 20 100 人数分布(F ):1 1 8 乙组: 考试成绩(X ): 0 20 100 人数分布(F ):8 1 1 加权均值 计算50 名工人日加工零件数的均值 集中趋势 计算和运用算术平均数是需要注意: 算术平均同时受到两个因素的影响,一个是各组的观察值的大小,另一个是各组分布频数的多少 算术平均值易受极端值干扰 集中趋势 ? 中位数 含义:把观察值按从小到大的顺序排列,位置居中的数叫做中位数 求下列各组数据的中位数 1)1 ,2,3,3,3,4,6,8,8,8,9,9 中位数是:5 2)1 ,2,3,3,3,4,8,8,8,9,9 中位数是:4 公式 MEDIAN 集中趋势 中位数是一种较为常用的反映集中趋势的特征数字 1.不受极端值的影响,具有很强的抗干扰性 2.由组距频数分布资料计算中位数时,要求等距组数,且要求观察值在中位数所在的组中近似服从对称分布,否则计算结果可能存在误差 3.对于观察值大量重复的现象,中位数未必准确 四分位数 (概念要点) 1. 集中趋势的测度值之一 2. 排序后处于25%和75%位置上的值 3. 不受极端值的影响 4. 主要用于定序数据,也可用于数值型数据,但不能用于定类数据 QL QM QU 25% 25% 25% 25% 集中趋势 截尾均值 含义:去掉观察值中部分最大值和最小值,由保留下来的数据计算平均值称为截尾均值。 离散趋势的测度 离散趋势的测度,在统计学中也称为指标变异指标,是用来描述数列中指标值的离散趋势与离散程度的。常用的标志变异指标有极差、平均差和标准差等。 1. 极差 极差是指一个数列中两个极端值即最大值与最小值之间的差异。根据极差的大小能说明标志值变动范围的大小。其计算公式为: 极差=最大标志值-最小标志值 根据组距数列求极差的计算公式为: 极差=最高组上限-最低组下限 在实际工作中,极差可以用于检查产品质量的稳定性和进行质量控制。在正常生产的条件下,产品质量稳定,极差在一定范围内波动,若极差超过给定的范围,就说明有不正常情

文档评论(0)

sandaolingcrh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档