- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三十讲交叉验证(CV)
第三十讲. 交叉验证(CV)
2017.6.1
11
交叉验证(CV,Cross-validation)
C /AIC/BIC准则都是基于现有数据对预测误差或MSE的In-sample估
p
计。缺陷:有效性的前提是假设已知或可以估计真模型。
通行的而且更可靠的方法是使用新数据(out-of-sample )测试模型性
能、估计预测误差。模仿建模-预测的过程,将数据分为两部分:
•训练样本(training sample): 用来建立模型和预测方法
•检验/测试样本(testing sample): 用来评价训练得到的预测或模型。
Training Testing/Validation
训练 验证
22
leave-one-out CV:总样本量n,
每次将其中一个观察作为测试集,
其它n-1个观察作为训练数据集训练模型,预测测试集的响应变量。
对于线性模型,leave-one-out 的预测误差PRESS:
n n 2
e
( ) ˆ 2−i i
PRESS ( ) ,
=− y y
∑ i i ∑ 2
i 1 (1 i 1 ) −hii
ˆ ˆ 1 −1~
β利用β − X (X {)e x }
- ( ) i 1−h i i
ii
缺点:
(1)训练数据集太相似;
(2 )测试集太小
33
K
K - fold Cross - Validation :
1 {1,2,, } n K ,...,D (D n/ K)
()将数据点 随机划分为 组 1 K 每组样本量≈ ,
您可能关注的文档
最近下载
- GB 50689-2011 通信局(站)防雷与接地工程设计规范.docx VIP
- 麻醉科PDCA提高术中主动保温率.pptx VIP
- 日本留考(EJU)日本语真题平成22年第2回听力原文.pdf VIP
- 2026届高考语文复习:“沉默的智者与无脑的喷子”漫画作文训练与指导.docx
- 山洪灾害预警预报技术_任波 李卫平 黄立志 著_2018_5.pdf
- 澄清函、中标成交通知书(优质模板).docx VIP
- 电信变更操作人员考试题.docx
- 《抗菌药物临床合理应用》知识培训试题及答案.docx VIP
- 颞下颌关节第八版讲义.ppt VIP
- 2024年山东省巨野县人民医院公开招聘护理工作人员试题带答案详解.docx VIP
文档评论(0)