面向基因表达数据的致病基因挖掘方法研究-精密仪器及机械专业毕业论文.docx

面向基因表达数据的致病基因挖掘方法研究-精密仪器及机械专业毕业论文.docx

VJUjjjul N叫ing University of Aeronautics and Astronautics ηle Gradua忧 School College of Automatization 晶Research of Disease Genes Identification 晶 ,.. ?ased 00 Microarray data 咱 A Thesis in Precision InstruInent and Mechanism Engineering by Zhang Huan Ping Advised by Prof. Wang Hui Nan Submitted in Partial Fulfillment ofthe Requirements for 也eDegreeof Docωr of Philosophy June,2009 ? 电 . 承诺书 本人声明所黑交的博士学位论文是本人在导师指导下进行的研究 工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京航 空航天大学或其他教育机构的学位或证书而使用过的材料。 本人授权南京航空航天大学可以将学位论文的全部成部分内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、 汇编学位论文。 (保密的学位论文在解密后适用本承诺书〉 作者签名:教燥举 日期:为\0、山飞 南京航空航天大学博士学位论文 摘要 复杂疾病致病基因挖掘对于了解疾病的发病机理和提高医学临床水平具有重要的意义.生 物倍息学作为当今生命科学研究的重要途径,通过揭示人类基因组及遗传语言的规律,挖掘威 胁人类健康的各种族病的致病基因,提高人樊对疾病的认识及治疗水平.随着许多高通量实验 技术手段的不断发展和完善,多种类型的隐含着生命本质规律与疾病信息的生物数据正迅猛增 伏,如何利用生物信息学方法从这些海最数据中藏得奇闸的信息,挖掘出与复如疾病相关的荔 因已成为具有挑战意义的新课题。基因芯片表达谱检测技术是基因组学研究方法的重要突破, 大规模的基因表达数据为基因功能研究提供了新的机遇,促进了复杂疾病致病基因拮据、致病 基因网络关系及疾病亚型分析的研究进展.各种功能强大的致病基因预测软件也为致病基因研 究提供了便捷的途径. 本文研究目的是用生物信息学方法对基因表达数据分析处理,挖掘出隐含在基因表达数据 中的与疾病相关的基因,并运用各种致病基因预测软件对潜在的致病基因进行排序,得到疾病 基因的相关倍息,提高人类对疾病机理的认识。本文的主要工作及创新性成果如下: 1.提出了基于奇异值分解的致病基因挖掘算法 LRSVDo 针对奇异值分解 (SVD) 方法中 用奇异值方楚评估特征模式的不足,提出用Lo gistic 回归系数代替方差评估每一个特征模式对 分类的作用大小.进一步提出了基因内权的定义,建立了特征模式与原始基因表达数据之间的 线性映射关系,基因内积可用来评估每一条基因的分类能力,根据基因内积的大小对基因排序, 选择对样本分费能力高的基因.将 LRSVD 算挫应用于基因表达数据,得到了一组分类准确率 高的基因子集,这些基因与疾病相关。 2. 提出了基于改进的混沌变异离散粒子群的特征基肉选择算法 CMDPSOo 基本离散粒子 群算法由于粒子在运功过程中产生惰性而发生早熟收敛, CMDPSO 算法引入了泪沌机制和遗传 算法的变异机制,混炖作为一种优化机制可用来产生初始粒子,其遍历性使初始粒子将新的模 式不断引入到搜索空间,并对适应度低的粒子进行初始化,利用遗传算法的变异机制避免粒子 陷入周部极值,从而快速得到最优解。 CMD附0算法应用于基因表达数据,得到了优化的刷 子集。 3. 提出了基于互信息和最大团的差异共表达政病基因挖掘方法Ml Cliqueo 1?.倍息作为相 似性度最函数评估荔因之间的共表达关系,得到基因在不同样本中的互信息值矩阵,选取阙值 将互信息矩阵二值化,将不同样本中的二值化矩阵的元素进行‘与操作,将得到的矩阵转化 为固的邻接矩阵:提出了用最大团方法从固的邻接矩阵中挖掘具有援异共表达模式的基因模块, 最大团中的顶点代表基因,钱代表基因之间的相互作用关系 o MICliq时算法避免了穷举式的基 面向慕因表达数据的致病基因挖掘方法研究 因搜索,能快速挖掘出差异共表达 3虫病基剧模块。对 MIClique 方法挖掘出的基因模块,不仅研 究单个基因的生物功能,并研究基因共间参与的生物通路及产生其表达模式的生物机制. 4. 介绍了目前常用的致病基因预测软件,提出了用巴 ND巴AVOUR 软件来预测基因 GAD2 是否为肥胖症政病基因,讨论了训练基因和数据类型

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档