- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因表达与杂交阵列数据库:GEO1
罗烈伟
广东药学院生物化学与分子生物学教研室,广州(510006 )
E-mail: llw@
摘 要:随着基因芯片技术的广泛应用,产生了海量的数据,为基因研究提供大量高通量数
据资料。为有效地组织、存取、管理如此大量的基因数据信息,隶属于美国国立卫生研究院
的NCBI 于2000年7月启动了基因表达数据库计划,目的是尽量最大范围覆盖所有可能的高通
量实验方法,并保持数据库的灵活性以适应未来发展的趋势,GEO的主要功能是用来储存的
检索高通量基因表达和杂交阵列数据。本文介绍一下当今最大、最全面的基因表达数据库
GEO的构成、数据的提交与下载、数据检索与分析等。
关键词:GEO;基因芯片;数据挖掘
0. 前言
近几年来,随着分子生物学技术的发展,微阵列芯片技术已成为生物学研究最重要的实
验之一,尤其是基因芯片的广泛应用,产生了海量的数据,为基因研究提供大量高通量数据
资料。为有效地组织、存取、管理如此大量的基因数据信息,迫切需要一个统一管理的公共
数据库、建立一种通用的数据标准格式,使数据能更好地与其它信息资源比较分析[1] 。几个
实验室和机构开始试图组建网上资源来散布这些高通量数据集[2],隶属于美国国立卫生研究
院的 NCBI (National Center for Biotechnology Information) ,开始了一个基因表达汇编计划,
即:基因表达综合库 (Gene Expression Omnibus, GEO) ,以便更好的支持公共使用和散布基
因表达数据。GEO 网上登录网址是:/projects/geo.
GEO致力于建立一个开放的基因表达数据仓库和在线资源,用于从任何物种或人造的
来源检索基因表达数据,其数据格式支持MIAME(minimum information about a microarray
experiment) 。GEO数据库创建于2000年,是当今最大、最全面的公共基因表达数据资源,至
今已存储了214,268个样本,8300个记录,4500个平台。GEO数据库覆盖广泛的生物学内容,
包括疾病、代谢、药理学、药学、免疫学和生态学等。数据来自世界各地实验室研究者的提
交,有些杂志要求文章发表时将数据提交到一些公共数据库,其目的是可以让一些独立的研
究机构来重新评价和分析这些数据的结果。可以提交的数据类型包括核苷酸阵列( cDNA 、
寡核苷酸、基因组),抗体阵列,组织阵列,比较基因组杂交(comparative genomic
hybridization,CGH ),基因表达系列分析(serial analysis of gene expression,SAGE),高度平行信
号序列测定(massively parallel signal sequencing,MPSS ),质谱分析蛋白质组等技术,来自这
些技术的实验数据都可被接受、登记和存档。一系列预先计算的数据的定义和描述,以及用
于交互检索和分析这些数据的在线工具都被放入。
1. GEO的构成
GEO把研究者递交的数据分成三个等级的实体类型,分别是平台( platform) 、系列
( series) 和样本( sample),它们每个均可保存到独立相关的数据库,因为它们分别被赋予了一
[3]
个唯一的、永恒不变的标志符 。GEO 的组成图解和实例见图1.1 。
1本课题得到广东省医学科研基金立项(项目编号 2008314 )的资助。
- 1 -
A
提交者
平台 样本
您可能关注的文档
最近下载
- DB37T 5093-2017非固化橡胶沥青防水涂料工程应用技术规程.docx
- 企业内部控制培训精完整版PPT课件-2024鲜版.ppt VIP
- 人乳头瘤病毒感染护理.pptx VIP
- 压疮品管圈成果汇报PPT幻灯片.ppt VIP
- 车险承保方案.pdf VIP
- 中华民族共同体概论教案合集(第一讲-第十六讲)附《中华民族共同体概论》课程大纲.doc VIP
- “中华民族共同体概论”课程教学与建设关键问题探讨.docx VIP
- 诸侯纷争与变法运动【课件】.pptx VIP
- 中国高血压防治指南(2024年修订版)_中国高血压防治指南修订委员会__.pdf VIP
- “扬子石化杯”2024年第38届中国化学奥林匹克(江苏赛区)初赛化学.pdf VIP
文档评论(0)