数理统计与随机过程参数估计.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数理统计与随机过程参数估计

如果 n = 10 、h = 0.1, 那么每个样本点各自的贡献能够清楚的观察到 。 数值计算结果: 如果 n = 1、h1=1 h1=1 h1=0.5 h1=0.1 在二维情况下有类似的结果: K Nearest Neighbor Density Estimation 在 Parzen窗法中: 体积由 先确定 体积内的点数不确定 在K-近邻估计中: 体积内的点数 kN 先确定 体积再由包含 kN 个最近邻点来确定VN 基本公式仍然为: K-近邻估计 如果设 ,随着N增大,KN增大,所以体积也就增大。 如果x点附近密度低,体积增大速度就快; 如果x点附近密度高,体积增大速度就慢。 可以克服Pazzen窗对于初值V1的依耐性 基本公式: K-近邻估计 假设条件: 一个较好的确定kN的方法: K-近邻估计举例 用直方图估计概率密度函数,和用 Parzen 窗估计概率密度函数有什么联系和区别? * * * * * * * * * * * * * 兰州大学信息科学与工程学院 主讲: 路永刚 E-mail: ylu@ 非正态总体的区间估计 §7.6 非正态总体的区间估计 前面两节讨论了正态总体分布参数的区间估计。但是在实际应用中,我们有时不能判断手中的数据是否服从正态分布,或者有足够理由认为它们不服从正态分布。但是,只要样本大小 n 比较大,总体均值 μ 的置信区间仍可用正态总体情形的公式 或 σ2已知时 σ2未知时 所不同的是:这时的置信区间是近似的。 这是求一般总体均值的一种简单有效的方法,其理论依据是中心极限定理,它要求样本大小 n 比较大。因此,这个方法称为大样本方法。 设总体均值为 μ, 方差为σ2 , X1, X2, …, Xn 为来自总体的样本。因为这些样本独立同分布的,根据中心极限定理,对充分大的 n, 下式近似成立 因而,近似地有 于是, μ 的置信系数约为1-α 的置信区间为 当σ2未知时,用σ2的估计S2 来代替σ2,得 只要 n 很大,(2)式所提供的置信区间在应用上是令人满意的。 那么,n 究竟多大才算很大呢? 显然,对于相同的 n , (2)式所给出的置信区间的近似程度随总体分布与正态分布的接近程度而变化,因此,理论上很难给出 n 很大的一个界限。 但许多应用实践表明: 当 n≥30时,近似程度是可以接受的; 当 n≥50时,近似程度是很好的。 例1:某公司欲估计自己生产的电池寿命。现从其产品中随机抽取 50 只电池做寿命试验。这些电池寿命的平均值为 2.261 (单位:100小时),标准差 S=1.935。求该公司生产的电池平均寿命的置信系数为 95% 的置信区间。 解:查正态分布表,得 zα /2= z0.025=1.96,由公式 (2),得电池平均寿命的置信系数为 95% 的置信区间为 设事件 A 在一次试验中发生的概率为 p, 现在做 n 次试验,以Yn记事件 A 发生的次数,则 Yn ~ B(n, p)。依中心极限定理,对充分大的 n,近似地有 7.6.1 二项分布 (3)式是(1)式的特殊情形。 (4)式就是二项分布参数 p 的置信系数约为1-α 的置信区间。 例2:商品检验部门随机抽查了某公司生产的产品100件,发现其中合格产品为84件,试求该产品合格率的置信系数为0.95的置信区间。 解:n=100, Yn=84, α =0.05, zα/2=1.96, 将这些结果代入到(4)式,得 p 的置信系数为0.95的近似置信区间为 [0.77, 0.91]。 例3:在环境保护问题中, 饮水质量研究占有重要地位, 其中一项工作是检查饮用水中是否存在某种类型的微生物。 假设在随机抽取的100份一定容积的水样品中有20份含有这种类型的微生物。试求同样容积的这种水含有这种微生物的概率 p 的置信系数为0.90的置信区间。 解:n=100, Yn=20, α =0.10, zα/2=1.645, 将这些结果代入到(4)式,得 p 的置信系数为0.90的近似置信区间为 [0.134, 0.226]。 7.6.2 泊松分布 设 X1, X2 ,…, Xn 为抽自具有泊松分布P(λ )的总体的样本,因为 E(X)=D(X) = λ ,由: 例4:公共汽车站在一单位时间内 (如半小时,或1小时, 或一天等) 到达的乘客数服从泊松分布 P( λ ), 对不同的车站, 不同的仅是参数 λ 的取值不同。 现对某城市某公共汽车站进行100个单位时间的调查。这里单位时间是20分钟

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档