- 1、本文档共56页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
上节课内容总结.ppt
上节课内容总结 统计推断基本概念 统计模型:参数模型与非参数模型 统计推断/模型估计:点估计、区间估计、假设检验 估计的评价:无偏性、一致性、有效性、MSE 偏差、方差、区间估计 CDF估计: 点估计、偏差、方差及区间估计 统计函数估计 点估计 区间估计/标准误差 影响函数 Bootstrap Bootstrap也可用于偏差、置信区间和分布估计等计算 本节课内容 重采样技术(resampling) Bootstrap 刀切法(jackknife) 引言 是一个统计量,或者是数据的某个函数,数据来自某个未知的分布F,我们想知道 的某些性质(如偏差、方差和置信区间) 假设我们想知道 的方差 如果 的形式比较简单,可以直接用上节课学习的嵌入式估计量 作为 的估计 例: ,则 ,其中 ,其中 问题:若 的形式很复杂(任意统计量),如何计算/估计? Bootstrap简介 Bootstrap是一个很通用的工具,用来估计标准误差、置信区间和偏差。由Bradley Efron于1979年提出,用于计算任意估计的标准误差 术语“Bootstrap”来自短语“to pull oneself up by one’s bootstraps” (源自西方神话故事“ The Adventures of Baron Munchausen”,男爵掉到了深湖底,没有工具,所以他想到了拎着鞋带将自己提起来) 计算机的引导程序boot也来源于此 意义:不靠外界力量,而靠自身提升自己的性能,翻译为自助/自举 1980年代很流行,因为计算机被引入统计实践中来 Bootstrap简介 Bootstrap:利用计算机手段进行重采样 一种基于数据的模拟(simulation)方法,用于统计推断。基本思想是:利用样本数据计算统计量和估计样本分布,而不对模型做任何假设(非参数bootstrap) 无需标准误差的理论计算,因此不关心估计的数学形式有多复杂 Bootstrap有两种形式:非参数bootstrap和参数化的bootstrap,但基本思想都是模拟 重采样 通过从原始数据 进行n次有放回采样n个数据,得到bootstrap样本 对原始数据进行有放回的随机采样,抽取的样本数目同原始样本数目一样 如:若原始样本为 则bootstrap样本可能为 计算bootstrap样本 重复B次, 1. 随机选择整数 ,每个整数的取值范围为[1, n],选择每个[1, n]之间的整数的概率相等,均为 2. 计算bootstrap样本为: Web上有matlab代码: BOOTSTRAP MATLAB TOOLBOX, by Abdelhak M. Zoubir and D. Robert Iskander, .au/downloads/bootstrap_ toolbox.html Matlab函数:bootstrp Bootstrap样本 在一次bootstrap采样中,某些原始样本可能没被采到,另外一些样本可能被采样多次 在一个bootstrap样本集中不包含某个原始样本 的概率为 一个bootstrap样本集包含了大约原始样本集的1-0.368 = 0.632,另外0.368的样本没有包括 模拟 假设我们从 的分布 中抽取IID样本 ,当 时,根据大数定律, 也就是说,如果我们从 中抽取大量样本,我们可以用样本均值 来近似 当样本数目B足够大时,样本均值 与期望 之间的差别可以忽略不计 模拟 更一般地,对任意均值有限的函数h,当 有 则当 时,有 用模拟样本的方差来近似方差 模拟 怎样得到 的分布? 已知的只有X,但是我们可以讨论X的分布F 如果我们可以从分布F中得到样本 ,我们可以计算 怎样得到F?用 代替(嵌入式估计量) 怎样从 中采样? 因为 对每个数据点 的质量都为1/n 所以从 中抽取一个
您可能关注的文档
- 一、治理的概念二、社区治理的体制三、善治理念的形成四、.ppt
- 一、法令依據.ppt
- 一、活动对象.doc
- 一、相互影响在经济的基础上.ppt
- 一、看拼音,写词语。.doc
- 一、纳税人培训.ppt
- 一、经典马克思主义产生的社会文化背景和形成的主要阶段.ppt
- 一、经济学专业毕业论文选题.doc
- 一、考点解析.ppt
- 一、考点解读2004年高考题2005年高考题2006年高考题《.ppt
- 2024-2030年中国高端矿泉水行业市场深度调研及发展趋势与投资前景研究报告.docx
- 2024-2030年中国高级咖啡机行业市场发展趋势与前景展望战略分析报告.docx
- 2024-2030年中国高糖果酱行业市场发展趋势与前景展望战略分析报告.docx
- 2024-2030年中国鳄鱼皮具行业现状调查与前景预测分析研究报告.docx
- 2024-2030年中国高档化妆品行业市场发展分析及发展趋势与投资战略研究报告.docx
- 2024-2030年中国高档时装市场调研及发展策略研究报告.docx
- 2024-2030年中国高钛渣行业市场深度调研及发展趋势与投资前景预测研究报告.docx
- 2024-2030年中国高附加值用钢行业运行动态及发展战略分析研究报告.docx
- 2024-2030年中国高速列车制动系统行业市场发展趋势与前景展望战略分析报告.docx
- 2024-2030年中国高蛋白奶粉行业市场深度调研及发展趋势与投资前景研究报告.docx
文档评论(0)