特征样本重复抽样建模方法设计与应用LIBAOYU.pdf

下载文档 降价啦

76
0
约1.15万字
约 50页
2017-07-10 发布于浙江
举报
版权申诉
保障服务

特征样本重复抽样建模方法设计与应用LIBAOYU.pdf

1、本文档共50页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

特征样本重复抽样建模方法设计与应用LIBAOYU

特征样本重复抽样建模方法设计与应用 • （Features Sample Resampling Regression，FSR） • （尚未公开发表，请勿外传，仅供内部学术交流） •山西财经大学统计学院 •山西财经大学统计研究院 •李宝瑜 •2016.7 当前统计建模的困难 •1、数据来源困难 •2、数据不稳定 •3、要求大样本 •4、各种检验标准越来越苛刻 •在社科研究领域，几乎没有一个人一个模型能通过各种检验一、传统统计回归模型的特征与缺陷： •1、单样本回归 • 样本稳定性差。在一个总体中，样本是否能够代表总体并不一定，也不稳定。在很多情况下，甚至样本容量增加或减少1，回归结果就可能发生很大变化，在相同的样本容量下，如果样本随中某个数字发生变化，也有可能使得回归结果出现较大变化。 •2、大样本回归 • 很多情况下缺乏大样本。即使有大样本，在总体很大很大时，样本方差也不一定能够代表总体方差。假设检验的效果不一定很好。 3、假设检验 • 任何一种检验，都基于某种分布假设，很多情况下假设的正确性无法验证。 •单样本回归用于参数检验的统计量为： ˆ  i t i ˆ  c i i •每个样本能够估计出来1个系数值，1个该分布的抽样误差， 1个T值，但每个样本估计的结果都不同。假设检验的抽样分布图： •任何一次估计的参数，都是抽样分布上的一个点而已，不能知道分布的参数均值。每个样本估计结果都是无偏估计，但无偏估计是一个族。 •假设检验为： H 0 :  i 0 H 1 :  i  0 •单样本方法无法估计出来唯一或稳定的总体参数均值和随机误差，即无法得知一个抽样分布唯一的标准差。而在未知分布均值和标准差的情况下，检验标准是否正确，本身就是一个随机事件。 •t统计量只能检验参数均值是否等于0，而不能检验参数是否等于均值。p值可能正确，也可能不正确。美国统计学会发布的p值声明中也指出了这一点。二、传统统计建模方法的几种改进 •小样本改良 •稳健性统计 •Bootstrap方法，通过多次抽样模拟分布 •蒙特卡洛模拟，通过多次实验，模拟的思想 •实验设计（响应面优化）--重视样本的组合，对样本进行优化三、看看其它学科的建模思想 •数学的建模思想线条拟合 •运筹学的建模思想在目标和约束条件下求解 •计算机与信息科学建模思想--机器学习 •物理学的建模思想量纲分析法四、FSR的建模思想 • 各种传统建模思想的最大的缺陷在于我们无法通过一个样本的参数来得知一个分布的均值。所有的回归参数统计检验都是假定总体均值为0，而不是一个具体的数值。（T检验为例） • 所以，只能检验总体均值是否为0.而不能得知样本参数对总体均值的距离。 • 各种经典意义上的小样本方法和稳健性方法，虽然能改善一些参数估计的质量，但不会改变本质。无论如何改，也无法达到大样本效果。 • Bootstrap方法也有其很多的局限性，特别是采用随机抽样法采样时难以控制样本的有序性和避免极端值。为了改进 Bootstrap方法对样本的控制力不足的缺陷，人们又发展了 Bayesian Bootstrap方法，该方法也称为随机加权法 (Donald B.Rubin,1981)是对样本中的不同观察随机地赋予一定的权重，这样能够在一定程度上改善样本的质量。此外，为了加强Bootstrap方法的稳定性，有很多人将Quenouille 1949年提出的Jackknife （刀切法）方法与Bootstrap结合使用