《DAVID使用方法介绍》.docx

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DAVID使用说明文档 一、 DAVIDW 介 DAVID (the Database for Annotation , Visualization and Integrated Discovery ) 的网址是 /c DAVID是一个生物信息数据库,整合了生物学数据和分析工具,为大规模的基因或蛋白列表(成白上千个基因 ID或者蛋白ID列表) 提供系统综合的生物功能注释信息,帮助用户从中提取生物学信息。 DAVID这个工具在2003年发布,目前版本是v6.7。和其他类似的分析工具,如 GoMiner, GOstat等一样,都是将输入列表中的基因关 联到生物学注释上,进而从统计的层面,在数千个关联的注释中,找出最显著富集的生物学注释。最主要是功能注释和信息链接。 二、 分析工具: DAVID需要用户提供感兴趣的基因列表,在基因背景下,使用提供的分析工具,提取该列表中含有的生物信息。这里说的基因列表和 背景文件的选取对结果至关重要。 基因列表:这个基因列表可能是上游的生物信息分析产生的基因 ID列表。对丁富集分析而言,一般情况下,大量的基因组成的列 表有更高的统计意义,对富集程度高的特殊Terms有更高的敏感度。富集分析产生的p-value在相同或者数量相同的基因列表中具 有可比性。 DAVID对丁基因列表的格式要求为每行一个基因 ID或者是基因ID用逗号分隔开。基因列表的质量会直接影响到分析结果。这里定 性给出好的基因列表应该具有的特点,一个好的基因列表至少要满足以下的大部分的要求: 包含与研究目的相关的大部分重要的基因(如标识基因)。 基因的数量不能太多或者太少,一般是 100至10000这个数量级。 大部分基因可以较好的通过统计筛选, 例如,在控制组和对照组样品问选择显著差异表达基因时, 使用的t-test标准:fold changes >=2 && P-values <=0.05 。 大部分是上下调的基因都涉及到特定的某一生物过程,而不是随机的散布到所有可能的生物过程中。 一个好的基因歹0表比起随机产生的一个基因列表,应该含有更丰富的生物信息。 在同样的条件下,列表具有高度可重复性。 高通量数据的质量能够被其他独立的实验证实。 以上(2), (3), (6) & (7)是来自上游的数据标准,DAVID会自动检查其余的各项要求,即(1), (4) & (7)。 基因背景:在一项研究中,如果一个生物过程不正常,那么通过高通量筛选技术,对该过程共同作用的基因有更大的可能性被选为 相关的一组。富集分析正是以此为基础。为检测富集的程度,必须选取一个背景来进行对比。基因背景的选取有一个指导原则,就 是必须构建一个足够大的,研究者可能涉及的所有基因的集合。用户使用默认的背景文件(默认为该物种的所有基因) ,或者是上 传一个基因列表文件作为基因背景。 DAVID为实现各项功能分析,提供了以下 4个分析内容(共6个分析工具): Gene Name Batch Viewer 这个工具能够实现 将基因ID迅速翻译成基因名称,从而给研究者对于基因ID列表一个直观的印象,初步判断基因列表是否符 合要求目的。 图1中显示了该工具的分析结果,具体说明图 1中标注。 Gene List Report Ca-irr#1 n* Li1*-*: G—niAH.i: p vjfrr**1 ri V II ?■■< Jli^r !>&■ r twfl: >■?? fwt-o ?i- 1-M5 AT 35?7?AT UBIB.AT t3*7_AT JLOJ lCf—AT 1-M5 AT 35?7?AT UBIB.AT t3*7_AT JLOJ lCf—AT ”K J*/ ?4 73_AT M5I9_AT <1^ T ?12_S_ATT 1?3?_S_A.T ■X『yir AGWSq.M ?572_*T XW AT hr<4 ■5 _ Gene blamed Translated Bfi 1 nput Gene lt5s IS? 图 1 Gene Name Batch Viewer 的分析结果 Gene Functional Classification 这个工具是Gene NameBatch Viewer X具的延伸。由丁基因名称并不能显著体现基因的功能,所以我们需要更加有效的功能分 类工具。该工具基丁它们共同的注释信息,而不是基因名称,采用全新的模糊聚类算法, 能够实现将功能相关的基因聚到一起 作为一个单元,在生物学网络水平上去研究这些基因群 。对聚类结果打分,分值越高,代表该组内的基因在基因列表中越重要 同时还提供了 2-D View,以热图形式展现聚类到同一组的基因和该组内各个 结果见图2,将列表中的基因ID作为聚类对象,将功能相关的基因分组显示 T

文档评论(0)

kanghao1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档