数据、模型与决策第三、四章精要.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据、模型与决策 秀秀老师 第一节 图表描述分析 第二节 数量资料的特征数字 原始数据: 10 5 9 13 6 8 集中趋势 算术平均数: 含义:假定 为样本观察值,用 表示算术平均数,则算术平均数的基本计算公式为 特殊考虑:对于已经过分组并形成频数分布的资料,此时计算算术平均数就要采用加权的办法。计算加权算术平均数时,需要对各个组的变量值与相应组的频数的乘积求和,然后除以频数之和 加权均值 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组: 考试成绩(X ): 0 20 100 人数分布(F ):1 1 8 乙组: 考试成绩(X ): 0 20 100 人数分布(F ):8 1 1 加权均值 集中趋势 计算和运用算术平均数是需要注意: 算术平均同时受到两个因素的影响,一个是各组的观察值的大小,另一个是各组分布频数的多少 算术平均值易受极端值干扰 集中趋势 ? 中位数 含义:把观察值按从小到大的顺序排列,位置居中的数叫做中位数 求下列各组数据的中位数 1)1 ,2,3,3,3,4,6,8,8,8,9,9 中位数是:5 2)1 ,2,3,3,3,4,8,8,8,9,9 中位数是:4 公式 集中趋势 中位数是一种较为常用的反映集中趋势的特征数字 1.不受极端值的影响,具有很强的抗干扰性 2.由组距频数分布资料计算中位数时,要求等距组数,且要求观察值在中位数所在的组中近似服从对称分布,否则计算结果可能存在误差 3.对于观察值大量重复的现象,中位数未必准确 四分位数 (概念要点) 1. 集中趋势的测度值之一 2. 排序后处于25%和75%位置上的值 集中趋势 截尾均值 含义:去掉观察值中部分最大值和最小值,由保留下来的数据计算平均值称为截尾均值。 例子 1,3,4,7,8,9,10 求极差 R=10-1=9 极差 1. 一组数据的最大值与最小值之差 2. 离散程度的最简单测度值 3. 易受极端值影响 4. 未考虑数据的分布 极差是离散程度的最简单测度值,它只利用了一组数据的两个极端值,易受极端值的影响,且不能反映中间数据的分散状况。 比如:1,6,6,6,6,6,10这一组数据,极差是? R=10-1=9 和上一组极差值相同,都是9,如果以此断言两组数据离散程度相同,恐怕很不合适,直觉告诉我们后一组数据的差异比前一组数据大的多。 离散系数 上面介绍的各离散程度的测度值,反映的是数据分散程度的绝对值,其数值的大小取决于原变量值绝对水平的高低。 举个例子: 两组数据: 第一组:5,10,20,25,30 第二组:100000,100005,99995,100020,100040 第一组数据极差=25 第二组数据极差=45 第一组数据平均差=8.4 第二组数据平均差=14.4 第一组数据方差=107.5标准差=10.36822 第二组数据方差=332.5标准差=18.23458 第一组的离散系数=10.36822/8.4=1.23 第二组的离散系数=18.23458/14.4=1.26 对平均水平不同或计量单位不同的不同组别的变量值,不能直接的用上述离散程度的测度值进行直接的比较各组的离散程度。为了消除变量值水平的高低和计量单位不同对离散测度值的影响,我们计算离散系数值。 离散系数一般是用标准差计算的,也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标,其计算公式为: 离散系数 (概念要点和计算公式) 1. 标准差与其相应的均值之比 2. 消除了数据水平高低和计量单位的影响 3. 测度了数据的相对离散程度 4. 用于对不同组别数据离散程度的比较 5. 计算公式为 相关性测量 相关系数反映变量间线性相关关系的重要指标。 计算公式: 属性资料的特征数字 属性资料的集中趋势的测度主要是:众数、中位数、四分位数 属性资料的离散趋势的计算方法,常用的有离散比率、GINI-SIMPSON指数和熵等 第四章 参数样本推断 第一节 统计量与抽样分布 统计量 X1,X2,…,Xn为来自总体X的样本,称不含未知参数的样本的函数f(X1,X2,…,Xn)为统计量.若x1,x2,...,xn为样本观测值,则称f(x1,x2,...,xn)为统计量f(X1,X2,…,Xn)的观测值. 统计量是处理、分析数据的主要工具.对

文档评论(0)

文档资料 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档