概率论第六章课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概率论第六章课件

第六章 样本及抽样分布 引言(1) 数理统计: 以概率论为基础,根据试验或观察得到的数 据来研究随机现象,并对研究对象的客观规律性 做出种种合理估计和判断。 数理统计的内容: (1) 收集、整理数据资料; (2) 对所得的数据资料进行分析、研究; (3) 对所研究对象的性质、特点作出判断,即统计 推断问题。 引言(2) 数理统计与概率论的区别: 概率论中随机变量的分布都是假设已知的,在这 一 前提下来研究随机变量的性质、特点和规律性。 在数理统计中,所研究的随机变量的分布是未知 或不完全知道的,需要对随机变量进行重复独立的 观 察,对观察值数据进行分析,对所研究的随机 变量的分布作出种种推断。 总体(1) 总体:数理统计中随机试验的全部可能的观察值。 个体:随机试验每个可能的观察值。 总体的容量:总体中所包含的个体的数目。 有限总体和无限总体 2000名大学生的身高观察值,湖泊中某种鱼的含汞量; 湖泊任意点的深度。 总体(2) 说明: (1) 有限总体容量很大时,可认为是一个无限总体。 (2) 一个总体对应一个随机变量,总体中的个体即为随 机变量的取值,以后将不加区分两者。 (3)实际中遇到的总体往往是有限总体,它对应一个离 散型随机变量。 (4) 从总体中抽取一个个体是指对总体进行一次试验并 记录结果。 样本 (1) 存在背景: 在数理统计中,人们都是通过从总体中抽取一部分个体,根据获得的数据对总体分布作出推断。 定义: 设X是具有分布函数F 的随机变量,若X1, …Xn是具有同一分布函数F 的相互独立的随机变量,则称X1, …Xn为由总体X得到的容量为n的简单随机样本,简称样本。 记法: 样本( X1, …Xn ) 样本值 ( x1, …xn ) 样本 (2) 性质: 设总体X的分布函数为F(x), 概率密度为f (x), 则 (1) X1, X2,…,Xn是相互独立的随机变量; (2) X1, X2,…,Xn是服从同一分布函数F(x); (3) (X1, X2 …,Xn)的分布函数和概率密度分别为 总体样本值统计分析的手段 在数理统计中,由随机试验得到总体样本值的一堆数据,它们能反映出总体分布的一些性质。 数据是杂乱无章的,很难从表面看出总体的性态,需要借助一些手段对数据进行统计分析。 手段: 直方图; 箱线图; 直方图的画法 找出n个数据的最大的和最小的数据。 取一个区间,这个区间的下限要比最小数据稍小,上限要比最大数据稍大。 将取到的区间平均分成k个小区间,k的选取依据: 当n较大时,k 取10~20; 当n50时, k 取5~6; 分点要比数据精度高一位,防止数据落在分点上。 数出落在每个小区间内数据的频数 fi,并算出频率 fi /n, i =1, 2, 3…k 直方图的说明 直方图中每个小矩形的面积,等于数据落在该小区间内的频率。 直方图的外廓曲线接近于总体X的概率密度曲线 从直方图可以估计X 落在某一区间内的概率(用频率近似) 样本值的p分位数 (0p1) 定义:设 x1, x2,…,xn为容量为n的样本观察值,它们的 p 分位数xp满足下面两个性质: 至少有np个观察值小于或等于xp; 至少有n(1-p)个观察值大于或等于xp p分位数确定的步骤: 将按从小到大的顺序排成; 计算np ,则 第一四分位数 Q1: p = 0.25; 中位数Q2: p = 0.5; 第三四分位数 Q3: p = 0.75 箱线图 画法: 找出最大、最小数据Max, Min, 计算Q1,Q2 ,Q3 ; 画一水平轴,在轴上标明Max, Min , Q1,Q2 ,Q3 ; 在水平轴上方画一个左右两侧分别对应Q1,Q3 的矩形箱子,并在箱子内画一条与Q2对应的垂直线段; 在箱子左侧引一条水平线至Min ,并在同一高度箱子的右侧引一条水平线至Max; 箱线图反映的数据性质 中心位置: 数据集的中心,中位数所在的位置; 散布程度: 区间[Min, Q1], [Q1, Q2], [Q2, Q3], [Q2, Q3], [Q3, Max]内的数据个数各约占总数据的1/4, 区间越短,表示落在该区间内的点越集中。 对称性: 若中位数位于箱子中间,则数据分布均匀对称。 疑似异常值的确定与处理 异常值产生的源泉: 数据的测量、记录或输入计算机时的错误 ; 数据来自不同的总体

文档评论(0)

wyjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档