面向基因微阵列数据分类的混合特征选择-计算机技术专业毕业论文.docxVIP

  • 3
  • 0
  • 约5.37万字
  • 约 60页
  • 2019-05-26 发布于上海
  • 举报

面向基因微阵列数据分类的混合特征选择-计算机技术专业毕业论文.docx

万方数据 万方数据 西安电子科技大学 学位论文独创性(或创新性)声明 秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下 进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内 容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技 大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 本人签名: 日期: 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读 学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留送交论文的复印件, 允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其 它复制手段保存论文。同时本人保证,毕业后结合学位论文研究课题再撰写的文章一律署名 单位为西安电子科技大学。 (保密的论文在解密后遵守此规定) 本学位论文属于保密,在 年解密后适用本授权书。 本人签名: 导师签名: 日期: 日期: 万方数据 万方数据 摘要 基因微阵列数据有着维数高、样本少、高冗余以及高噪声的特点,使得无法 使用传统的模式识别方法对其进行分析。在对基因微阵列数据进行分类预测时, 通常会先采用特征选择算法对数据进行去冗余和降维的处理,筛选出对分类有重 要贡献的特征,从而有效降低计算复杂度并提高分类预测的准确率。本文针对基 因微阵列数据的特征选择和分类进行了研究,主要工作如下: (1)设计了将 Filter 和 Wrapper 相结合的混合基因特征选择算法,其中 Filter 主要以 F-score 作为评价准则,Wrapper 中则以两种不同的方式将 SVM-RFE 和 SVM-RFA 相结合,提出 SVM-RFEA 算法和 SVM-DEA 算法。由于 SVM-RFE 和 SVM-RFA 实质上都是贪心算法,都存在容易陷入局部最优的缺点。但如果将这两 种算法结合起来,是可以一定程度上对各自的缺陷有所弥补的,并有效提高预测 的准确率。 (2)鉴于集成学习在处理高维小样本数据上的天然优势,本文将多分类器集 成起来进行基因微阵列数据的分类和预测,采用不同的特征子集分别训练分类器 以构造有差异的基分类器,在保证了高效性的前提下,更增加了分类器的稳定性。 将所提的特征选择算法在八个公开的基因数据集上进行了实验验证,实验结 果证明了其有效性。 关键词:基因微阵列 Filter Wrapper 混合特征选择 集成学习 万方数据 万方数据 Abstract It is difficult to analyze gene microarray data for its characteristics of high dimensionality and small sample size. The most used approach to classify or predict microarray data is carrying out feature selection firstly, in order to reduce computation complexity and improve prediction accuracy. In this paper, we proposed two novel methods based on hybrid feature selection algorithm to analyze and identify microarray data. The main attributions are as follows: Two kinds of hybrid feature selection algorithms, termed as SVM-RFEA and SVM-DEA, were proposed, which combined Filter and Wrapper feature selection methods. The Filter part is mainly use F-score as evaluation criteria, and the Wrapper part is use SVM-RFEA and SVM-DEA (combining the SVM-RFE and SVM-RFA in two different ways) as the evaluation criteria. Since SVM-RFE and SVM-RFA both essenti

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档