- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据库是生物信息学的主要内容, 各种数据库几乎覆盖了生命科学的
各个领域。核酸序列数据库有 GenBank, EMBL, DDBJ 等,蛋白质序
列数据库有 SWISS-PROT, PIR, OWL, NRL3D, TrEMBL 等, 蛋白质片
段数据库有 PROSITE, BLOCKS, PRINTS 等, 三维结构数据库有 PDB,
NDB, BioMagResBank, CCSD 等,与蛋白质结构有关的数据库还有
SCOP, CATH, FSSP,3D-ALI, DSSP等,与基因组有关的数据库还有
ESTdb, OMIM, GDB, GSDB 等,文献数据库有 Medline, Uncover 等。
另外一些公司还开发了商业数据库 ,如 MDL 等。 生物信息学数据库覆
盖面广,分布分散且格式不统一 , 因此一些生物计算中心将多个数据
库整合在一起提供综合服务, 如 EBI 的 SRS(Sequence Retrieval System)
包含了核酸序列库、蛋白质序列库,三维结构库等 30 多个数据库及
CLUSTALW、 PROSITESEARCH 等强有力的搜索工具,用户可以进
行多个数据库的多种查询。
基因和基因组数据库
Genbank
Genbank库包含了所有已知的核酸序列和蛋白质序列, 以及与它们相 关的文献著作和生物学注释。它是由美国国立生物技术信息中心
(NCBI)建立和维护的。它的数据直接来源于测序工作者提交的序列;
由测序中心提交的大量EST序列和其它测序数据;以及与其它数据
机构协作交换数据而来。Genbank每天都会与欧洲分子生物学实验室 (EMBL)的数据库,和日本的DNA数据库(DDBJ)交换数据,使这三 个数据库的数据同步。Genbank的数据可以从NCBI的FTP服务器上 免费下载完整的库,或下载积累的新数据。 NCBI 还提供广泛的数据
查询、序列相似性搜索以及其它分析服务,用户可 以从 NCBI 的主页上找到这些服务。
Genbank库里的数据按来源于约55,000个物种,其中56%是人类的 基因组序列(所有序列中的34%是人类的EST序歹U)。每条Genbank 数据记录包含了对序列的简要描述,它的科学命名,物种分类名称, 参考文献,序列特征表,以及序列本身。序列特征表里包含对序列生 物学特征注释如:编码区、转录单元、重复区域、突变位点或修饰位 点等。所有数据记录被划分在若干个文件里,如细菌类、病毒类、灵
长类、啮齿类,以及EST数据、基因组测序数据、大规模基因组序 列数据等16类,其中EST数据等又被各自分成若干个文件。
(1)Genbank数据检索
NCBI的数据库检索查询系统是 Entrez。Entrez是基于 Web界面的综
合生物信息数据库检索系统。 利用 Entrez 系统, 用户不仅可以方便地
检索Genbank的核酸数据,还可以检索来自 Genbank和其它数据库
的蛋白质序列数据、基因组图谱数据、来自分子模型数据库 (MMDB)
的蛋白质三维结构数据、
种群序列数据集、以及由PubMed获得Medline的文献数据。
Entrez提供了方便实用的检索服务,所有操作都可以在网络浏览器上 完成。用户可以利用Entrez界面上提供的限制条件(Limits)、索引 (Index)、检索历史(History)和剪贴板(Clipboard)等功能来实现复杂的 检索查询工作。 对于检索获得的记录, 用户可以选择需要显示的数据,
保存查询结果,甚至以图形方式观看检索获得的序列。更详细的
Entrez使用说明可以在该主页上获得。
⑵向Genbank提交序列数据
测序工作者可以把自己工作中获得的新序列提交给 NCBI ,添加到
Genbank数据库。这个任务可以由基于 Web界面的BankIt或独立程 序Sequin来完成。BankIt是一系列表单,包括联络信息、发布要求、 引用参考信息、序列来源信息、以及序列本身的信息等。用户提交序
列后,会从电子邮件收到自动生成的数据条目, Genbank的新序列编
号,以及完成注释后的完整的数据记录。用户还可以在 BankIt 页面
下修改已经发布序列的信息。 BankIt 适合于独立测序工作者提交少量
序列,而不适合大量序列的提交,也不适合提交很长的序列,EST序 列和GSS序列也不应用BankIt提交。BankIt
使用说明和对序列的要求可详见其主页面
大量的序列提交可以由Sequin程序完成。Sequin程序能方便的编辑 和处理复杂注释,并包含一系列内建的检查函数来提高序列的质量保 证。它还被设计用于提交来自系统进化、种群和突变研究的序列,可 以加入比对的数据。Sequin除了用于编辑和修改序列数据记录, 还可
以用于序列的分析,任何以F
您可能关注的文档
最近下载
- 人教版-小升初考试数学专题讲练:第21讲 植树问题.doc VIP
- 影棚及摄像器材租赁报价单.pdf
- 应用博弈论解决海盗分金问题.pptx VIP
- 2025年高考天津卷作文“车轮辐辏”审题立意及范文 .pdf
- 挖掘红色资源开发校本课程图文.pdf VIP
- 围手术期预防应用抗菌药物专项点评及干预效果分析.doc VIP
- 建筑施工危险源辨识及风险评价清单500项.pdf VIP
- 四川成都高新科技创新投资发展集团有限公司招聘笔试题库2025.pdf
- IATF16949--过程审核检查表-(含审核记录)-.pdf VIP
- 2026西南证券股份有限公司校园招聘300人考试备考试题及答案解析.docx VIP
原创力文档


文档评论(0)