6蛋白组相关数据库及使用总汇.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
蛋白质组相关数据库;第一节 蛋白质序列数据库;除了蛋白质序列数据之外,PIR还包含以下信息: (1)蛋白质名称、蛋白质的分类、蛋白质的来源; (2)关于原始数据的参考文献; (3)蛋白质功能和蛋白质的一般特征,包括基因表达、翻译后处理、活化等; (4)序列中相关的位点、功能区域。;;PIR提供三种类型的检索服务: 一是基于文本的交互式查询, 用户通过关键字进行数据查询。 二是标准的序列相似性搜索, 包括BLAST、FastA等。 三是结合序列相似性、注释信息 和蛋白质家族信息的高级搜索, 包括按注释分类的相似性搜索、 结构域搜索等。;2、SWISS-PROT ;(1)注释 在SWISS-PROT中,数据分为核心数据和注释两大类。 核心数据包括: 序列数据、参考文献、分类信息(蛋白质生物来源的描述) 注释包括: (A)蛋白质的功能描述; (B)翻译后修饰; (C)域和功能位点,如钙结合区域、ATP结合位点等; (D)蛋白质的二级结构; (E)蛋白质的四级结构,如同构二聚体、异构三聚体等; (F)与其它蛋白质的相似性; (G)由于缺乏该蛋白质而引起的疾病; (H)序列的矛盾、变化等。;(2)最小冗余; 提交序列数据 (a)编辑电子表格 (b) 利用Authorin程序 (c)WWW服务器 使用SWISS-PROT (a)CD-ROM形式 (b)ftp服务器 (c)Gopher服务器 (d)WWW服务器(SRS) 与序列相关的操作 (a)序列查询 (b)搜索同源蛋白质序列 ;TrEMBL (http://www.ebi.ac.uk/trembl/index.html) 是与SWISS-PROT相关的一个数据库。 包含从EMBL核酸数据库中根据编码序列(CDS)翻译而得到的蛋白质序列,并且这些序列尚未集成到SWISS-PROT数据库中。 TrEMBL有两个部分: (1)SP-TrEMBL(SWISS-PROT TrEMBL) 包含最终将要集成到SWISS-PROT的数据,所有的SP-TrEMBL 序列都已被赋予SWISS-PROT的 登录号。 (2)REM-TrEMBL(REMaining TrEMBL) 包括所有不准备放入SWISS-PROT的数据,因此这部分数据都没有登录号。 ; 包括: Swiss-Prot TrEMBL PIR 用户可以通过文本查询数据库,可以利用BLAST程序搜索数据库,也可以直接通过FTP 下载数据。; UniProt包含3个部分: (1)UniProt Knowledgebase(UniProt) 蛋白质序列、功能、分类、交叉引用等信息存取中心 (2)UniProt Non-redundant Reference(UniRef)数据库 将密切相关的蛋白质序列组合到一条记录中 以便提高搜索速度; (3)UniProt Archive(UniParc) 资源库,记录所有蛋白质序列的历史。 ;How to search? ;NCBI Homepage;Genbank - Protein Homepage;Protein – AGGF1;Protein – development;Protein – Limit;Protein – development - limited;Protein - 其他特别主题 (Advanced);Protein - 其他特别主题;Protein - 其他特别主题 – 搜索结果;Protein – 某一蛋白信息;Protein – 某一蛋白信息;Protein – 某一蛋白信息;Protein – 某一蛋白信息;Protein – 某一蛋白信息 – FASTA格式;;CDD – Conserved Domain Database;CDD – transferrin;CDD – transferrin;CDD – CD Search;CDD – CD Search – How to use; 通过SRS从EBI中获取蛋白质序列信息 ;SRS开始页面 ;SRS快速文本检索窗口 ;SRS检索结果页面显示的检索结果 ;SRS蛋白质记录详细内容页面 ;SRS蛋白质序列显示窗口 ; SRS标准检索页面 ;SRS标准检索页面检索基因名为“KRAS”蛋白序列输入示意图 ;SRS标准检索结果输出页面 ;第二节 生物大分子结构数据库;一种是显式序列信息(explicit sequence) 在PDB文件中,以关键字SEQRES作为显式序列标记,以该关键字打头的每一

文档评论(0)

金不换 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档