- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要
随着信息技术的不断发展,在金融、气象预测、基因研究等一些领域中,统
计学家常能够收集到高维数据。但由于维数过高,传统的统计分析方法和变量选
择方法变得不再稳健和难以适用。并且还有其他的难题需要去克服,例如当误差
分布为厚尾分布时,它们的效率都普遍较低甚至它们会变得无法适用;还有当自
变量间存在严重的多重共线性时,这也会严重干扰到变量选择方法的筛选效果。
为了克服多重共线性,本文突破性地提出能够应对存在多重共线性高维线性数据
的稳健的高维特征筛选法。
本文的主要工作如下:
第一章阐述了在面临高维数据时变量筛选的研究现状与历史,并且对一些常
用特征筛选方法进行了回顾和学习,最后对本文的内容安排和创新点进行了说明。
第二章中提出一种针对多重共线性的高维特征筛选法,可处理存在多重共线
性这类型的高维数据。当下很多针对高维线性模型的研究都是基于单一的边际效
应下进行的,变量的筛选依赖于变量之间相互独立,这使得当存在变量间存在多
重共线性时可能导致变量筛选的不稳定性,本文通过引入净效应的这一概念,让
自变量的净效应替代其边际效应,提出一种基于全局影响的特征筛选方法,这使
得其筛选方法的适用范围更广,并进一步通过证明得到了确定筛选性质。
第三章通过数值模拟和实例分析中与其他筛选方法比较的结果说明了推广
后的筛选方法更具稳定性。
第四章总结了本文所提出的特征筛选方法,并对可以进一步地去研究的方
向进行展望。
关键词:高维线性数据;多重共线性;特征筛选;筛选确定性质
I
Abstract
With the continuous development of information technology, statisticians are
often able to collect high-dimensional data in some fields such as finance, weather
forecasting, and genetic research. However, due to the high dimensionality, traditional
statistical analysis methods and variable selection methods are no longer robust and
difficult to apply. And there are other problems to be overcome. For example, when
the error distribution is thick-tailed, they are generally inefficient or even become
unsuitable; and when there is serious multicollinearity between independent variables,
It will also seriously interfere with the screening effect of the variable selection
method. In order to overcome multicollinearity, this paper proposes a robust
high-dimensional feature screening method that can cope with the existence of
multicollinear high-dimensional linear data.
The main work of this article is as follows:
In Chapter 1, it expounds the research status and history of variable screening in
the face of high-dimensiona
您可能关注的文档
最近下载
- avy-m-nr中文版快速启动手册.pdf VIP
- 古诗词知识竞赛题附答案内容初中生古诗词知识竞赛.doc VIP
- 国际压力性损伤-溃疡预防和治疗临床指南(2025年版)解读PPT课件.pptx VIP
- 苏教版科学六年级上册 4.11《太阳系大家族》大单元教学设计(含练习).docx
- 2025年广东省基层住院医师线上岗位培训《外科病证》-中医学专业培训课程专业课答案.doc VIP
- 海南国际旅游岛少儿英语二年级上册全册练习.doc
- 部编版小学语文三年级上册第三单元单元教材分析解读整体设计(新版).pptx VIP
- 天然药物学 果实与种子类药材酸枣仁小茴香连翘马钱子等护理课件.pptx VIP
- 中国珠宝首饰传统文化 宋 宋朝时期首饰.pptx VIP
- “抖音”短视频在新媒体环境下的传播模式与内容研究.docx VIP
文档评论(0)