- 1、本文档共123页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
概率分布 试验实例 E1: 抛一枚硬币,分别用“H” 和“T” 表示出正面和反面; E2: 将一枚硬币连抛三次,考虑正反面出现的情况; E3:将一枚硬币连抛三次,考虑正面出现的次数; E4:掷一颗骰子,考虑可能出现的点数; E5:记录某网站一分钟内受到的点击次数; E6:在一批灯泡中任取一只,测其寿命; E7:任选一人,记录他的身高和体重。 事件发生的标志 由于事件是随机试验的每一个可能结果,可表示为样本空间的某个子集。 所以,事件A的发生,当且仅当试验的结果是子集A中的元素。 由此,必然事件即为一个试验中所有基本事件的集合,包含了样本空间的所有样本点;不可能事件不包含样本空间的任一样本点,为一空集。 事件关系的实质 由上可知,事件之间的关系由他们所包含的样本点所决定; 由此,事件之间的这种关系也可以用集合之间的关系来描述。 偏度的意义(三级动差) 表示偏度的指标实际上是z分数的三次方的算术平均数。 由公式可以看出,正态分布时,由于左右对称,z分数的三次方的总和应等于0;而正偏态时,由于平均数右边的z分数值较大,故z分数三次方总和的绝对值较左边为大,故z分数三次方的总和大于0;而负偏态则相反。 峰度的意义(四级动差) 表示峰度的指标实际上与z分数的四次方的算术平均数有密切关系。 当两曲线的标准差相同时,曲线越高狭,两极端分数的分布次数越多,峰度值就会越大;反之,曲线越低阔,两极端分数的分布次数越少,峰度值就会越小。 故,峰度值为0时,分布为正态;峰度值大于0时,分布为高狭峰;峰度值小于0时,分布为低阔峰。 二项分布的极限分布是正态分布 公式表达: 式中,y为次数,N为总人数,X为测量分数。 若左式中的N取为1,便是正态分布的密度函数,即: 连续和离散型随机变量概率分布的区别 连续型随机变量 1)连续型随机变量记做X; 2)随机变量特殊值记做x; 3)连续型概率分布(概率密度函数)记做f(x); 4)P(X=x)=0; 5) 6) 离散型随机变量 1)X表示离散型随机变量; 2)x表示随机变量特殊值; 3)离散型概率分布(概率分布函数)记做f(x); 4)P(X=x)=f(x); 5) 6) 大数原则与Z分布 大数原则 从公式可以看到,样本平均数的标准误与母总体的标准差成正比,而与样本容量n成反比,样本容量越大,样本平均数的标准误越小。 Z分布 无论母总体的分布,还是样本平均数的分布,都可以通过求标准分数Z,将各自的正态分布形式转换成标准正态分布。此时,标准正态分布的随机变量为z分数,故标准正态分布也称Z分布。 样本平均数的Z分布和t分布总结 参数估计 统计推断 (statistical inference) 被估计的总体参数 第一节 点估计、区间估计 一、点估计(point estimation) 从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计。 例如: 用样本均值作为总体未知均值的估计值。 注意:点估计没有给出估计值接近总体未知参数程度的信息。 二、良好估计的标准 无偏性:估计量的数学期望等于被估计的总体参数。(用多个样本的统计量作为总体μ的估计值,其偏差的平均数为零。) 是 μ的无偏估计, 是 的无偏估计。 有效性:一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量相比,样本均值是一个更有效的估计量。 一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数 充分性:一个样本容量为n的样本统计量,是否充分反映了全部n个数据所反映总体的信息。 例如,平均数比众数、中位数的充分性高; 比Q、AD的充分性高。 三、区间估计(interval estimation) 根据一个样本的观察值给出总体参数所在的区间范围,并给出总体参数落在这一区间的概率。 例如: 总体均值落在50-70之间,置信度为 95%。 注意:区间估计是在点估计的基础之上进行的,并不具体指出总体参数等于什么。 决定区间边界值的因素 样本点估计值(如样本平均数) 联系总体参数和样本点估计的样本统计量(如Z统计量) 该统计量的抽样分布(如果样本平均数服从正态分布,则Z统计量的抽样分布是标准正态分布) 落在总体均值某一区间内的样本均值 置信水平 总体未知参数落在某一区间内的概率,表示为 1 - ?。此时,??为显著性水平,是总体参数未在某一区间内的概率?。 常用的置信水平值有0.99,0.95,0.90。相应的 ??为0.01,0.05,0.10。 区间与置信水平 区间估计的原理
您可能关注的文档
- 儿童画色彩搭配课件.ppt
- 动物防疫员培训讲义.ppt
- 二年级猜谜游戏课件.ppt
- 电子商务模式课件.ppt
- 电生理概述课件.pptx
- 电气化铁路基础知识课件.ppt
- 电话约访技巧课件.ppt
- 电路和电路模型课件.ppt
- 电子商务技术平台课件.ppt
- 电话话术培训邀约话术课件.ppt
- DB44_T 2611-2025 城市排水管网有毒有害气体监测与风险分级管理技术标准.pdf
- DB44_T 2612-2025 竞赛类科普活动策划与实施服务规范.pdf
- DB43_T 2947-2024 烟草种子质量控制规程.pdf
- DB37_T 4836-2025 煤矿风量实时监测技术要求.pdf
- 叉车防撞系统,全球前22强生产商排名及市场份额(by QYResearch).docx
- 超滤膜,全球前18强生产商排名及市场份额(by QYResearch).docx
- DB62T 4172-2020 玉米品种 酒623规范.pdf
- DB62T 4160-2020 在用真空绝热深冷压力容器综合性能在线检测方法.pdf
- DB62T 4164-2020 辣椒品种 酒椒1号.pdf
- DB62T 4133-2020 公路隧道地质超前预报机械能无损探测技术规程.pdf
文档评论(0)