摘要
摘要
在大数据背景下,数据量的迅猛增长以及数据标签缺失、异常值污染等问
题对降维技术提出了新挑战。通过梳理国内外在概率主成分分析(PPCA)及其
扩展模型方面的研究进展,分析了相关模型在降维应用中的局限性:例如,基于
2
高斯分布的半监督概率模型(SPPCA)虽能有效利用缺失标签数据,但传统高
斯分布在处理异常值时缺乏稳健性。为克服这一局限,已有研究提出了采用学
摘要
摘要
在大数据背景下,数据量的迅猛增长以及数据标签缺失、异常值污染等问
题对降维技术提出了新挑战。通过梳理国内外在概率主成分分析(PPCA)及其
扩展模型方面的研究进展,分析了相关模型在降维应用中的局限性:例如,基于
2
高斯分布的半监督概率模型(SPPCA)虽能有效利用缺失标签数据,但传统高
斯分布在处理异常值时缺乏稳健性。为克服这一局限,已有研究提出了采用学
文档评论(0)