一种新的概率非线性主成分分析模型的探讨.pdfVIP

下载本文档

10
0
约4.37万字
约 49页
2019-06-09 发布于江苏
举报

一种新的概率非线性主成分分析模型的探讨.pdf

一种新的概率非线性主成分分析模型的探讨第1章绪论第l章绪论本章介绍了课题的研究背景、相关内容的研究现状及本文的主要工作和论文的章节安排。 1．1课题的研究背景及意义主成分分析的概念已经诞生了一个世纪之久，但是针对主成分分析理论的研究和发展一直都没有停止，尤其是计算机应用为主成分分析提供了更广阔的空间。主成分分析有严格的统计学基础，很多关于多元统计的教材都有介绍主成分分析及其相关内容的章节。主成分分析的应用包括：数据压缩、特征提取、针对某些具体问题做出综合评价的决策支持系统【1】，及与其他方法结合，例如用主成分作为新的自变量代替原变量作回归的主成分回归；以及当原变量的重要程度存在较大差异时，对原变量加权再进行主成分分析的加权主成分分析。但是，主成分分析在处理某些实际问题时会有一定的局限性。比如，对于来自多个分布的样本的混合，主成分分析只能将它们看成来自同一分布的样本，计算该组样本的协方差阵，找到全体数据的最大变异方向。但这样得到的结果并非总是符合需求的，有时需要更为精确地分析数据的结构。对此，一种可能的解决方式为构造主成分分析的混合模型，即先将样本分类，再对基于不同类的样本分别做主成分分析，最后得到各类数据的特征。但是这种方法往往依赖于实际问题，而且没有统一的表达式。概率主成分分析是对传统主成分分析的扩展。它将主成分分析理论放在概率框架中进行讨论，给出了数据信息在主子空间中表达时所对应的概率密度估计。可以直观的理解为，传统主成分分析在通过样本点确定了主子空间后，对于每一个样本点，主子空间中存在唯一的点与之对应；概率主成分分析同样可以根据样本数据得到主子空间的估计，但是对每一个样本点，经概率模型得到的不是主子空间中与之对应的唯一的点，而是得到与之对应的点的概率密度。这个密度函数的均值向量即可以看作是与在主子空间中由传统主成分分析得到的确定点相对应的统计量。由此可见，概率主成一1一一种新的概率非线性主成分分析模型的探讨第1章绪论分分析在保持传统主成分分析特点的前提下，为之定义了一个恰当的概率模型，因此用这种概率模型的混合形式分析复杂数据会更恰当。而且混合模型的参数可以通望)算法可以提高运算效率，所以这种意义上的混合模型具有更好的泛化能力。在传统主成分分析中，样本在与主子空间正交的补空间中保存的信息被直接丢弃了。然而，在概率主成分分析模型中，这些信息被定义为噪声保存了下来。可见，概率主成分分析比传统主成分分析对数据的解释更为精确。基于概率模型的特点，概率主成分分析及其混合模型在实际应用的多个方面，较之传统主成分分析都有更好的表现，具体包括：可以处理含有缺失值的数据，数据分类，数据降维，图像压缩，数据可视化，流程控制12】等。但是，主成分分析和概率主成分分析处理数据都是基于对数据进行的线性变换，然而这种线性变换背景下的处理方法有时并不能满足实际需求。主成分分析和概率主成分分析通过对样本协方差阵进行特征值分解至多可以得到和样本空间维度一样多的特征。若需要更多特征来解释数据的结构，则这些基于线性变换的方法就无法实现了。核主成分分析是结合核方法的主成分分析，该方法弥补了主成分分析不能提取非线性特征的不足。核方法借助核函数实现样本空间到特征空间隐式的映射。核主成分分析相当于将样本点映射到高维特征空间，再在该特征空间中利用主成分分析方法分析样本的象。对于结合概率模型的非线性主成分分析，一个主要的方法是基于高斯过程隐含变量模型的概率非线性主成分分析。该方法巧妙地结合核技巧和概率模型对主成分分析进行了推广，在实际应用中有不错的表现，但它并不是对核主成分分析的直接扩展，对此本文提出了一种可能的扩展形式，并得到了一种区别于高斯过程隐含变量模型的概率非线性主成分分析模型。对于核主成分分析，考虑到高维特征空间的稀疏性以及复杂的分布情况，概率模型及其混合模型的引入理论上对模型会有改进的效果。与概率主成分分析相比，基于概率模型的核主成分分析因为运算时需要考虑核技巧，所以需要更多的参数、限定条件。因而，针对这一问题有很多方面可以继续探讨，例如：选择合适的参数，研究限制条件对模型的影响，以及结合核函数

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

一种新的概率非线性主成分分析模型的探讨.pdfVIP