基于混合线性模型和条件变量分析的DNA微阵列数据分析方法分析-生物信息与数量遗传学专业论文.docxVIP

基于混合线性模型和条件变量分析的DNA微阵列数据分析方法分析-生物信息与数量遗传学专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要7近年来DNA芯片技术日益成为研究大量基因表达连续变化的实验室工具。芯片技 摘要 7近年来DNA芯片技术日益成为研究大量基因表达连续变化的实验室工具。芯片技 术的发展使得同时获得成千上万个基因的表达谱成为可能。DNA芯片在产生的短短几 年时间已经显现出在基因序列分析、基因诊断、基因表达研究、基因组研究、发现新 基因及各种病原体的诊断等生物医学领域中的应用价值。利用芯片数据,“癌变基因” 的发现以及对飞速增长的基因组数据库增加功能注释等难题将迎刃而解。DNA芯片数 据具有高维(成千上万个基因)和样本小(通常小于30)的特点,为了避免对伪结果 进行分析,准确估计抽样方差很重要。在微阵列试验中既要包括真实的变化,又需要 随机的变异。大量研究表明,聚类分析及其相关技术对于挖掘基因表达的相关模式非 常有用。但是仅用这些方法不能对分析结果进行统计推断,难以得到具有生物学意义 的结论,尤其是不适合分析前后时间点数据高度相关的动态基因表达数据。A。。 本文描述的统计框架包含了基因表达分析的众多目标,与现有的分析方法完全一 致,同时提高了这些方法的效用。本文着重研究差别表达基因的鉴定。本研究提出了 基于混合线性模型的分析微阵列数据的方法,并将其应用于差别表达基因的鉴定、在 动态或静态过程中估算基因主效应以及预测基因与环境的互作效应。用蒙特卡罗模拟 r 对该方法的有效性和可靠性进行了比较系统的研究。/这种方法可以有效地将基因表达 ?L 水平根据变异来源的不同剖分为几个组成部分。主要研究内容和结论概述如下: 1.提出了分析芯片数据的一般模型,其中包括了基因、阵列效应、染料、处理效 应以及基因×阵列、基因×染料、基因×处理互作效应。根据不同的试验设计,该模 型可以做适当的调整。本文提出的方法主要分为两步来进行:首先,将芯片数据通过 噪音过滤消除大的试验系统误差,然后在~个比较宽松的标准下通过单基因模型初步 判断差异表达基因;其次,用多基因模型分析这些初定的差异表达基因以便在较严的 标准下控制假阳性。用MⅣ0uE法估计各项效应的方差和协方差分量,用AUP法预 测随机效应。基因和处理的互作效应作为鉴定差异表达基因的具体指标。 2.对新提出的基于混合线性模型分析DNA芯片数据的方法用蒙特卡罗模拟进行 Ill 了验证。模拟结果表明该方法在绝大多数情况下优于传统的t检验和Wolfinger提出的 了验证。模拟结果表明该方法在绝大多数情况下优于传统的t检验和Wolfinger提出的 混合模型方法。验证了基因和处理的互作效应可以作为鉴定差异表达基因的更为恰当 的指标。 3.研究表明我们提出的基于混合线性模型的方法可以无偏或近无偏地估算固定效 应和预测随机效应。对基因主效应的无偏估计值和基因与处理互作效应的无偏预测值 进行聚类可以获得具有统计学和生物学意义的结果。 4.将我们提出的混合线性模型进行拓展,可以用来分析动态的基因表达数据。我 们定义了一个新变量度量给定f.1时刻的基因表达量来确定t时刻的基因表达情况,用 条件变量的方法来估计条件方差、预测条件遗传效应,可以揭示在特定时间段基因表 达的变异情况。 5.对新提出的基于条件变量的分析芯片数据的方法进行了蒙特卡罗模拟研究。结 果表明基于条件变量的分析方法在大多数情况下表现得比差值法更有效。同时结果还 进一步显示了将基因和环境的互作效应作为鉴定差异表达基因的指标是非常有效的。 6.为了适应实际分析的需要,用c/c抖语言编写了软件,可以用于分析基因芯片 的表达数据,估算基因表达变异来源的方差组成和预测遗传效应,同时寻找差异表达 基因。 7.以几种药物处理特异癌症细胞系的实际芯片实验数据的分析为例,说明了本研 究所提方法的分析过程及分析所得结果的生物学意义a■ 关键词DNA微阵列·基因表达·混合线性模型·蒙特卡罗模拟·条件变量分析 一——~———一 .。一一 ~一 ‘ ∥一一 ABSTRACTMicroarrays ABSTRACT Microarrays are becoming increasingly more common laboratory tools for studying simultaneous changes in expression across a large number of genes.Recent developments in microarray technology make it possible to capture the gene expression profiles for thousands of genes at once.With this kind of data,researchers are tackling problems

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档