- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
特征样本重复抽样建模方法设计与应用LIBAOYU
特征样本重复抽样建模方法设计与应用
• (Features Sample Resampling Regression,FSR)
• (尚未公开发表,请勿外传,仅供内部学术交流)
•山西财经大学统计学院
•山西财经大学统计研究院
•李宝瑜
•2016.7
当前统计建模的困难
•1、数据来源困难
•2、数据不稳定
•3、要求大样本
•4、各种检验标准越来越苛刻
•在社科研究领域,几乎没有一个人一个模型能通过各种检验
一、传统统计回归模型的特征与缺陷:
•1、单样本回归
• 样本稳定性差。在一个总体中,样本是否能够代表总体
并不一定,也不稳定。在很多情况下,甚至样本容量增加或
减少1,回归结果就可能发生很大变化,在相同的样本容量
下,如果样本随中某个数字发生变化,也有可能使得回归结
果出现较大变化。
•2、大样本回归
• 很多情况下缺乏大样本。即使有大样本,在总体很大很
大时,样本方差也不一定能够代表总体方差。假设检验的效
果不一定很好。
3、假设检验
• 任何一种检验,都基于某种分布假设,很多情况下假设
的正确性无法验证。
•单样本回归用于参数检验的统计量为:
ˆ
i
t
i ˆ
c
i i
•每个样本能够估计出来1个系数值,1个该分布的抽样误差,
1个T值,但每个样本估计的结果都不同。
假设检验的抽样分布图:
•任何一次估计的参数,都是抽样分布上的一个点而已,不能
知道分布的参数均值。每个样本估计结果都是无偏估计,但
无偏估计是一个族。
•假设检验为:
H 0 : i 0
H 1 : i 0
•单样本方法无法估计出来唯一或稳定的总体参数均值和随机
误差,即无法得知一个抽样分布唯一的标准差。而在未知分
布均值和标准差的情况下,检验标准是否正确,本身就是一
个随机事件。
•t统计量只能检验参数均值是否等于0,而不能检验参数是否
等于均值。p值可能正确,也可能不正确。美国统计学会发
布的p值声明中也指出了这一点。
二、传统统计建模方法的几种改进
•小样本改良
•稳健性统计
•Bootstrap方法,通过多次抽样模拟分布
•蒙特卡洛模拟,通过多次实验,模拟的思想
•实验设计(响应面优化)--重视样本的组合,对样本进
行优化
三、看看其它学科的建模思想
•数学的建模思想线条拟合
•运筹学的建模思想在目标和约束条件下求解
•计算机与信息科学建模思想--机器学习
•物理学的建模思想量纲分析法
四、FSR的建模思想
• 各种传统建模思想的最大的缺陷在于我们无法通过一个样
本的参数来得知一个分布的均值。所有的回归参数统计检验
都是假定总体均值为0,而不是一个具体的数值。(T检验为
例)
• 所以,只能检验总体均值是否为0.而不能得知样本参数对
总体均值的距离。
• 各种经典意义上的小样本方法和稳健性方法,虽然能改善
一些参数估计的质量,但不会改变本质。无论如何改,也无
法达到大样本效果。
• Bootstrap方法也有其很多的局限性,特别是采用随机抽
样法采样时难以控制样本的有序性和避免极端值。为了改进
Bootstrap方法对样本的控制力不足的缺陷,人们又发展了
Bayesian Bootstrap方法,该方法也称为随机加权法
(Donald B.Rubin,1981)是对样本中的不同观察随机地赋予
一定的权重,这样能够在一定程度上改善样本的质量。此外,
为了加强Bootstrap方法的稳定性,有很多人将Quenouille
1949年提出的Jackknife (刀切法)方法与Bootstrap结合使
用
文档评论(0)