基因表达数据分析方法及其应用研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因表达数据分析方法及其应用研究

内容提要 本文首先阐述和分析了基因表达数据分析方法的研究现状、研究方法以及 所存在的问题,并在此基础上,提出了一套系统的基因表达数据分析工作流 程,并结合已有聚类方法实现了一种新的基因表达模拟数据生成算法,重点研 究了差异表达基因识别算法及其在蛋白质相互作用网络中的子网识别应用技 术。另外,结合多种类型的基因表达数据,通过有效的检验方法,验证了算法 的有效性及可行性。本文的主要贡献和研究内容如下: (1) 对微阵列技术和基因表达数据主要分析方法做了全面且系统的综述。 (2) 提出了一套系统的基因表达数据分析工作流程。 (3) 基于已有聚类方法和提出了一种新的基因表达模拟数据生成算法。 (4) 基于统计排名技术提出一种新的、简单而有效的差异表达基因识别算 法MRP。算法能有效排除基因芯片数据预处理方法对差异表达基因分析算法计算 结果的干扰,并且通过对矩阵整体排序计算,得到具有高准确度的统计排名结 果。 (5) 针对差异表达基因识别算法计算结果中存在“假阳性”的问题,采用 元分析技术并结合标准差检验方法提出了一个具有伪差异表达基因识别功能的 差异表达基因识别算法RSDM。 (6)将差异表达基因识别算法 MRP 与基于距离测定的蛋白质复合物识别方法 相结合,进而提出一种新的基于PPI的蛋白质子网模块识别算法。 本文在基因表达数据分析方面做出了具有理论意义和应用价值的研究工 作。为差异表达基因识别、蛋白质子网识别研究提供了有意义的方法和手段, 对生物学信息和医学的相关研究起到了一定的促进作用。 摘 要 摘 要 基因表达数据分析方法及其应用研究 微阵列技术是分子生物学领域具有里程碑式意义的重大突破,它可以同时 测量不同样本中成千上万个基因在不同环境和不同状态下的表达水平。基因表 达数据是基于 DNA 微阵列技术而产生的反映基因转录产物 mRNA 丰度值的一组数 据。数据中蕴含着丰富的基因活动信息。这些信息对于生物医学的研究有着重 要的作用,从中可以获取到细胞的生理状态、基因表达调控信息以及基因功能 等信息。通过对这些数据中所隐含的基因活动信息进行分析,进而加深人们对 生命现象的理解是生物信息研究工作的最终目的。 对于基因表达数据我们需要综合数据建模方法、计算智能算法,以及数理 统计等方法进行深入的分析与研究,才能从中挖掘出潜在的、具有生物学意义 的信息。然而,不同的数据分析处理方法会得到截然不同的分析结果,所以对 于不同类型的基因芯片数据选取适当的分析方法显得尤为重要。 在生物信息学和计算机科学等多学科交叉研究的背景下,本文展开了对于 基因表达数据相关分析方法的研究工作,主要内容包括: (1)提出了一种新的基于统计学习理论和聚类方法的基因表达数据分析工 作流程。工作流程是由数据预处理、差异表达基因识别、基因聚类和功能富集 分析组成的。通过实验,得到了具有生物学意义的实验结果从而验证了所提出 方法的有效性及可行性。 (2)由于昂贵的成本和过高的操作复杂性两种不利因素的影响,在一些研 究中很难通过实验的方法去获取有效而充足的基因表达数据。针对此问题,本 文提出了一种基于 K-Medoids 的基因模拟数据生成算法。算法中定义了聚类通 道等概念用于创建模拟数据。算法在创建模拟数据的同时清除了原始数据中存 在的噪声数据。使用 SAM 算法对原始数据和模拟数据进行了验证与分析、实验 结果表明,模拟产生的基因表达数据是可靠的。 (3)不同实验条件下差异表达基因的识别是微阵列数据分析的主要目标之 I 吉林大学博士学位论文 一。一类主要的分析方法是对基因表达值进行统计分析,高排名的基因具有显 著的差异表达性。提出了一种全新的基于简单统计排名模型的差异表达基因识 别算法MRP。算法可直接处理基因芯片原始数据,所以排除了数据预处理方法对 算法的干扰;另外,通过对基因芯片数据形成的矩阵进行整体排序计算,得到 具有高准确

文档评论(0)

tianebandeyazi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档