支持向量机在基表达数据中的研究.pdfVIP

  • 3
  • 0
  • 约6.68万字
  • 约 63页
  • 2016-03-24 发布于贵州
  • 举报
支持向量机在基表达数据中的研究

摘要 摘要 生物信息学近年来获得突破性进展,随着基因芯片技术的快速发展,基因 表达数据的获得已变得越来越快捷和可靠,这些数据提供了揭开生命奥秘的基 础。它们具有维数高,样本少的特点,远远超出传统分析方法的能力和速度所 能处理的范畴,基因表达数据的分析成为生物研究的瓶颈,其处理、挖掘、分 析和理解日益迫切。 Vector Machine,SVM)是一类基于统计学习理论的新型 支持向量机(Support 机器学习方法。它采用了结构风险最小化原则,能较好的解决小样本学习的问 题,尤其是针对维数高、样本小、非线性的微阵列基因表达数据,SVM表现出 了很好的性能。 本文主要研究基于支持向量机的基因表达数据分类,包括二分类和多分类。 首先介绍了生物信息学以及基因表达数据分析的研究现状,接着详细阐述了支 持向量机分类方法及相关理论。另外,针对基因表达数据“样本数目少,特征 维数高劳的实际情况,本文先对数据集采用信噪比方法进行特征选择,得到一 个基因子集;再对经过特征选择后得到的基因子集采用核主成份分析(KPCA) 等

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档