流形学习中非线性降维方法的研究和在烟草数据中的应用.pdfVIP

  • 9
  • 0
  • 约7.4万字
  • 约 57页
  • 2015-10-15 发布于安徽
  • 举报

流形学习中非线性降维方法的研究和在烟草数据中的应用.pdf

流形学习中非线性降维方法的研究及在烟草数据中的应用 手两 晏 对机器学习和数据挖掘等领域进行研究的目的之一是通过对高维数据的分 析和处理来探寻隐藏在其中的内部规律;但是由于现实世界的复杂性,越来越多 的数据呈现出维数过高、数据量过大、结构呈非线性、高增长率等特点;这对传 统的机器学习和数据挖掘分析方法提出了严峻的考验,而流形学习作为机器学习 一个新兴的数据分析方法,可以很好的发现高维数据分布的内在几何结构,挖掘 出高维数据内部规律及本征信息,有效结合可视化技术在低维空间来观测高维数 据内部特性。目前流形学习已经广泛应用于各个领域并取得了良好的效果。 本文分别对当前流形学习中主流的线性降维方法和非线性降维进行了理论 和应用的详细介绍,通过深入分析线性方法在处理某些高维数据所存在的局限性 的基础上恰当地引出非线性降维方法;本文重点研究和分析了非线性降维方法中 经典的LLE算法、ISOMAP算法,对两种算法在部分烟草数据集和人工数据集 进行了对比、分析和总结,发现了算法存在的共性问题…邻域内样本点个数的如 何正确选择。为更好的解决这个问题,本文主要做了以下几个方面的工作: 1、针对高维空间数据分布有可能呈现非线性的特点,本文适时地引入了核 变换思想,将原始数据空间通

文档评论(0)

1亿VIP精品文档

相关文档