- 5
- 0
- 约5.13万字
- 约 53页
- 2017-09-05 发布于安徽
- 举报
--完美WORD文档DOC格式,可在线免费浏览全文和下载,是一篇优秀的毕业设计论文,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文的提供参考。
安徽大学硕士学位论文
摘
要
摘要
基因表达谱数据分类研究就是通过分析 DNA 微阵列实验中所获取的基因表
达谱数据,发掘出不同样本间的基因表达差异,寻找基因与组织病变之间所存在
的内在联系。虽然模式识别领域的各种算法在这些年来都有了长足的发展,但是
在针对基因表达谱数据的分类研究中仍有许多问题需要解决。基因表达谱数据由
于其获取方式的独特性,具有高维度,低样本的特点。传统的机器学习方法在面
对这种数据时,无法取得较好的分类结果,并且其极高的运算复杂度,大大降低
了数据分析效率。
本文基于谱图理论展开针对基因表达谱数据的分类研究,将反映图结构的特
征表示引入到基因表达谱数据分类中,研究基因表达谱数据的特征提取及基于谱
图理论的基因谱表达数据分类方法,并对算法的性能进行分析。主要研究内容有:
1. 基因表达谱数据蕴含着大量的生物信息,如何有效地从中挑选出特征基
因将对算法的准确率及实时性产生巨大的影响。本文提出一种利用熵度量作为指
标进行癌症基因表达数据特征提取的方法。首先对基因表达数据进行筛选并计算
各个基因的熵,然后提取出熵最大的若干基因作为特征基因,并用支持向量机进
行分类。对前列腺癌基因表达数据的留一法以及分组法实验都证明了该方法的有
效性。
2. 尝试着将一种基于 Laplace 谱的算法应用于癌症基因表达谱数据的分类
上。该方法首先挑选出与类中心欧式距离
原创力文档

文档评论(0)