获取和蛋白质序列信息.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第31页,共37页,星期六,2024年,5月第五节通过SRS从EBI中获取蛋白序列信息SRS是世界上主要的生物信息学、基因组和相关数据综合、分析和显示工具。SRS检索系统是个开放的系统,可以根据不同的需要安装不同的数据库,现在,安装在EBI的数据库有200多个。SRS有三种检索方式,快速检索、标准检索和批量检索。第32页,共37页,星期六,2024年,5月我们可以通过网址(http://srs.ebi.ac.uk/srsbin/cgi-bin/wgetz?+quickSearch+-id+76e2D1aC0Ri)进入SRS开始页面第33页,共37页,星期六,2024年,5月第34页,共37页,星期六,2024年,5月第35页,共37页,星期六,2024年,5月在详细记录页面显示了蛋白的一般信息、蛋白来源和描述信息、产考文献信息、交叉链接、关键词和系列信息。点击“Sequence”按钮,查看蛋白序列第36页,共37页,星期六,2024年,5月*感谢大家观看第37页,共37页,星期六,2024年,5月关于获取和蛋白质序列信息生物信息学(Bioinformatics)在生命科学研究中发展起来的一门由分子生物学和计算机信息处理技术相结合,以计算机为工具对生物信息进行储存、检索、传播、模拟和分析的交叉学科,它利用数据库技术和软件技术对大量积累的生物大分子序列数据和实验测定的序列进行比较和分析,揭示出生物大分子的分子结构、功能和进化关系以及基因组构成与基因表达等生物学事件对生命活动的影响。第2页,共37页,星期六,2024年,5月生物信息数据库种类:基因组数据库、核酸和蛋白质一级结构序列数据库、生物大分子(主要是蛋白质)三维空间结构数据库、以上述三类一次数据库和文献资料为基础构建的二次数据库。第3页,共37页,星期六,2024年,5月一次、二次数据库特点一次数据库的数据量大、更新速度快、用户面广,存在过多的甬余数据。而二次数据库的容量比较小,更新速度也没有一次数据库那样快,经过筛选后,避免了过多的甬余数据。第4页,共37页,星期六,2024年,5月根据数据库存储的内容可将生物信息学数据库分为:核酸、蛋白质、基因图谱、结构、文献等数据库第5页,共37页,星期六,2024年,5月第二节核酸序列数据库一、GenBank数据库GenBank是一个综合数据库,该数据库中包含了已经公开的260000余种不同物种生物的核酸序列,这些数据主要是由全世界不同实验室和大规模测序计划提交给GenBank的。第6页,共37页,星期六,2024年,5月GenBank是具有目录和生物学注释的核酸序列综合数据库,由美国国家医学图书馆(NLM)的国家生物技术信息中心(NCBI)构建、维护和管理。该中心位于美国马里兰国家健康研究所(NIH)。NCBI构建GenBank数据库的序列数据来至序列发现者提交的序列、批量提交的表达序列标签(EST)、基因组测序序列(GSS)和其它测序中心的高通量数据,以及美国专利商标局提供的已发表专利的序列数据。第7页,共37页,星期六,2024年,5月GenBank、EMBL、DDBJ组成国际核酸序列数据库合作组织(INSDC),该组织成员远程合作,每天相互交换数据以保证序列信息的一致性和完整性。第8页,共37页,星期六,2024年,5月检索GenBank数据Entrez检索系统BLAST序列相似性搜索程序用FTP获取GenBank数据库第9页,共37页,星期六,2024年,5月Entrez系统使用Entrez(/sites/gquery)可以访问GenBank中的序列记录,Entrez是一个灵活的数据库检索系统,可以检索35个数据库。Entrez数据库包含来源于GenBank和其它资源的DNA和蛋白序列,还包括基因组图谱、种群、进化和环境序列序列数据集、基因表达数据、NCBI分类学、蛋白结构域信息和来源于MolecularModelingDatabase(MMDB)的蛋白结构数据库,每个数据库经由PubMed和PubMedCentral与学术文献关联。第10页,共37页,星期六,2024年,5月BLAST序列相似性搜索序列相似性搜索是GenBank数据最基本和使用最多的分析方式。NCBI提供BLAST(/Blast.cgi)系列程序检测一条查询序列与数据库所有序列的相似性。BLAST搜索可以在NCBI网站上运行,也可以在FTP站点下载独立的程序集运行。第11页,共37页,星期六,2024年,5月用FTP获取GenBankNCBI以传统的纯文本文件格式发布GenBank,还以AS

文档评论(0)

xiaoshun2024 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档