基因表达及杂交阵列数据库:GEO.pdfVIP

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因表达与杂交阵列数据库:GEO1 罗烈伟 广东药学院生物化学与分子生物学教研室,广州(510006 ) E-mail: llw@ 摘 要:随着基因芯片技术的广泛应用,产生了海量的数据,为基因研究提供大量高通量数 据资料。为有效地组织、存取、管理如此大量的基因数据信息,隶属于美国国立卫生研究院 的NCBI 于2000年7月启动了基因表达数据库计划,目的是尽量最大范围覆盖所有可能的高通 量实验方法,并保持数据库的灵活性以适应未来发展的趋势,GEO的主要功能是用来储存的 检索高通量基因表达和杂交阵列数据。本文介绍一下当今最大、最全面的基因表达数据库 GEO的构成、数据的提交与下载、数据检索与分析等。 关键词:GEO;基因芯片;数据挖掘 0. 前言 近几年来,随着分子生物学技术的发展,微阵列芯片技术已成为生物学研究最重要的实 验之一,尤其是基因芯片的广泛应用,产生了海量的数据,为基因研究提供大量高通量数据 资料。为有效地组织、存取、管理如此大量的基因数据信息,迫切需要一个统一管理的公共 数据库、建立一种通用的数据标准格式,使数据能更好地与其它信息资源比较分析[1] 。几个 实验室和机构开始试图组建网上资源来散布这些高通量数据集[2],隶属于美国国立卫生研究 院的 NCBI (National Center for Biotechnology Information) ,开始了一个基因表达汇编计划, 即:基因表达综合库 (Gene Expression Omnibus, GEO) ,以便更好的支持公共使用和散布基 因表达数据。GEO 网上登录网址是:/projects/geo. GEO致力于建立一个开放的基因表达数据仓库和在线资源,用于从任何物种或人造的 来源检索基因表达数据,其数据格式支持MIAME(minimum information about a microarray experiment) 。GEO数据库创建于2000年,是当今最大、最全面的公共基因表达数据资源,至 今已存储了214,268个样本,8300个记录,4500个平台。GEO数据库覆盖广泛的生物学内容, 包括疾病、代谢、药理学、药学、免疫学和生态学等。数据来自世界各地实验室研究者的提 交,有些杂志要求文章发表时将数据提交到一些公共数据库,其目的是可以让一些独立的研 究机构来重新评价和分析这些数据的结果。可以提交的数据类型包括核苷酸阵列( cDNA 、 寡核苷酸、基因组),抗体阵列,组织阵列,比较基因组杂交(comparative genomic hybridization,CGH ),基因表达系列分析(serial analysis of gene expression,SAGE),高度平行信 号序列测定(massively parallel signal sequencing,MPSS ),质谱分析蛋白质组等技术,来自这 些技术的实验数据都可被接受、登记和存档。一系列预先计算的数据的定义和描述,以及用 于交互检索和分析这些数据的在线工具都被放入。 1. GEO的构成 GEO把研究者递交的数据分成三个等级的实体类型,分别是平台( platform) 、系列 ( series) 和样本( sample),它们每个均可保存到独立相关的数据库,因为它们分别被赋予了一 [3] 个唯一的、永恒不变的标志符 。GEO 的组成图解和实例见图1.1 。 1本课题得到广东省医学科研基金立项(项目编号 2008314 )的资助。 - 1 - A 提交者 平台 样本

文档评论(0)

xuefei111 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档