- 22
- 0
- 约4.51万字
- 约 52页
- 2019-01-11 发布于上海
- 举报
基因表达谱数据挖掘的特征提取方法研究-信号与信息处理专业论文
独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的
独创性声明
本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得安徽大学或其他教育机构的 学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已 在论文中作了明确的说明并表示谢意.
学位论文作者签名:么%/蒡居 签字日期:加/f年乡月p日
学位论文版权使用授权书
本学位论文作者完全了解安徽大学有关保留、使用学位论文的规定,有权 保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借 阅.本人授权安徽大学可以将学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文.
(保密的学位论文在解密后适用本授权书)
学位论文作者签名:么船廖7乞 导师签名:夕鼋俊
签字日期:力Df r年么月p日 签字日期: 2口声 年多月/o日
万方数据
安徽大学硕士学位论文
安徽大学硕士学位论文 摘要
摘要
随着新分子生物学技术和DNA微阵列技术的迅速发展,在生物样本中可以 同时定量测量数以万计的基因表达水平,使用这一技术产生的基因表达谱数据能 够揭开隐含的、以前未知的生物学知识。近几年来,研究学者利用统计学和模式 识别等知识对微阵列基因表达谱数据进行分析,对致病的肿瘤基因进行有效的挖 掘,从而对肿瘤的类型作出准确的诊断和分类预测。然而针对高维小样本特点的 肿瘤基因表达谱数据来说,传统的数据处理方法在对肿瘤数据进行分析之前,普 遍都是将高维度的肿瘤数据转换为低维度之后再进行处理,在保证分类识别精度 的同时提高学习方法的性能和计算效率。
本文通过结合生物信息学和模式识别中的相关知识,对高维小样本特点的肿 瘤数据进行特征基因的提取,并对相应的实验结果进行了有效性分析,其主要研 究内容如下:
1.提出一种基于子模态性质的特征基因选择算法。首先,考虑到肿瘤基因 表达谱数据基因之间相关性的特点,将独立的基因属性转变为具有结构信息的邻 接图;其次,对表征基因关系的邻接矩阵构建子模性质的特征选择目标函数,然 后使用贪心算法求解,获得相应的特征基因子集;最后,将训练样本选取的特征 子集运用到测试样本分类中,使用KNN和SVM分类器进行分类识别,通过对
实验结果的分析说明了该方法的有效性。
2.针对高维小样本特点的肿瘤基因表达谱数据,将局部保持投影降维方法 应用于肿瘤基因表达谱特征基因提取中。该方法首先使用主成分分析(PCA)对高 维的原始数据进行降维和去噪,将处理后的数据通过保留99%的主成分作为对原 始数据的表征;然后利用LPP能够保持局部特征的优点作降维约减,在肿瘤数 据上对特征基因进行信息提取;最后分别使用KNN分类器和SVM分类器对肿 瘤数据进行有效分类,通过对三组公开的真实数据集进行实验与结果分析,验证 了该方法的可行性和有效性。 关键词:基因表达谱;子模性质;特征提取;局部保持投影;
万方数据
安徽大学硕士学位论文
安徽大学硕士学位论文 Abstract
Abstract
With the rapid development of new molecular biology techniques and DNA microarray technology,we Call quantitatively measure the expression levels of thousands genes from biological samples,and gene expression data generated by this technique Can reveal implicit and previously unknown biological knowledge.In recent years,researchers used the techniques of statistics and pattern recognition to analysis the microarray gene expression data and effectively excavate the pathogenic tumor genes,SO that we can make a correct diagnosis and classification prediction on the t
您可能关注的文档
- 华支睾吸虫六个未知基因的识别及pgk1和pgk2的生物学特性研究-病原生物学专业论文.docx
- 基因组学和蛋白质组学对新药研发的影响-情报学专业论文.docx
- 华易公司基于经营目标与绩效考核相结合的奖金考评体系研究-工商管理专业论文.docx
- 互联网金融下h银行财务风险管理研究-工商管理专业论文.docx
- 基于arm的linux平台上usb驱动实现-通信与信息系统专业论文.docx
- 厚壁毛竹与毛竹叶的比较解剖研究-植物学专业论文.docx
- 后勤管理系统设计与实现-软件工程专业论文.docx
- 基因工程化的系膜细胞系移植在体外及体内监测急性肾小球肾炎-外科学专业论文.docx
- 基于amt的换挡控制技术研究-车辆工程专业论文.docx
- 基因表达谱数据的特征选择与分类算法研究-计算机技术专业论文.docx
原创力文档

文档评论(0)