- 7
- 0
- 约47.87万字
- 约 73页
- 2024-04-02 发布于江西
- 举报
摘要
在大数据时代,我们时常会用到高维数据,充分降维可以在最大限度内保
留原始数据的信息。然而,充分降维方法又极其依赖原始数据,因此,对观测
数据的影响分析必不可少。基于条件密度函数的最小平均方差估计(Minimum
average(conditional)varianceestimationbasedondensityfunction,dMAVE)是一种
非常重要的充分降维方法。本文提出了对于dMAVE的局部影响分析方法。该方
法依托于一个度量模型扰动前后的降维空间之间距离的空间位移函数,通过引
入联合扰动,构建了基于dMAVE目标函数的局部影响分析理论体系,获得局部
影响评价统计量,用以评价所有样本点对于估计中心降维子空间的影响。为了
在该体系下获得影响评价统计量,本文在传统的dMAVE目标函数的基础上引入
了降维向量的约束构建拉格朗日函数,以此摆脱对dMAVE迭代算法的依赖性。
模拟研究表明dMAVE目标函数的局部影响分析方法的表现良好,可以处理具有
“掩蔽”效应的数据,成功识别出异常点。
关键词:充分降维;基于条件密度函数的最小平均方差估计;局部影响分析;
空间位移函数
Abstract
WeiXu
Statistics
DirectedbyFeiChen
Intheeraofbigdata,weoftenusehigh-dimensionaldata,andsufficient
dimensionreductioncanretaintheinformationoforiginaldatatothemaximum
extent.However,dimensionreductionmethodsreliesheavilyontheoriginaldata,so
itisnecessarytoanalyzetheinfluenceoftheobserveddata.Minimumaverage
(conditional)varianceestimationbasedondensityfunction(dMAVE)isavery
importantmethodforsufficientdimensionreduction.Thispaperproposesalocal
influenceanalysismethodfordMAVE.Thismethodreliesonaspacedisplacement
functionthatmeasuresthedistancebetweenthedimensionreductionspacewithand
withoutmodelperturbation.Byintroducingjointperturbation,thetheoreticalsystem
oflocalinfluenceanalysisbasedondMAVEobjectivefunctionisconstructed,and
localinfluenceassessmentstatisticisobtainedtoevaluatetheinfluenceofallsample
ontheestimatedcentraldimensionreductionsubspace.Inordertoobtainthe
influenceassessmentstatisticinthissystem,thispaperintroducestheconstraintof
dimensionreductionvectortoconstructtheLagrangefunctionbasedonthetraditional
dMAVEobjectivefunction,soastogetrido
原创力文档

文档评论(0)