获取和蛋白质序列信息.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一页,共三十四页,2022年,8月28日 生物信息学(Bioinformatics) 在生命科学研究中发展起来的一门由分子生物学和计算机信息处理技术相结合,以计算机为工具对生物信息进行储存、检索、传播、模拟和分析的交叉学科,它利用数据库技术和软件技术对大量积累的生物大分子序列数据和实验测定的序列进行比较和分析,揭示出生物大分子的分子结构、功能和进化关系以及基因组构成与基因表达等生物学事件对生命活动的影响。 第二页,共三十四页,2022年,8月28日 生物信息数据库种类 : 基因组数据库、 核酸和蛋白质一级结构序列数据库、 生物大分子(主要是蛋白质)三维空间结构数据库、 以上述三类一次数据库和文献资料为基础构建的二次数据库。 第三页,共三十四页,2022年,8月28日 一次、二次数据库特点 一次数据库的数据量大、更新速度快、用户面广,存在过多的甬余数据。 而二次数据库的容量比较小,更新速度也没有一次数据库那样快,经过筛选后,避免了过多的甬余数据。 第四页,共三十四页,2022年,8月28日 根据数据库存储的内容可将生物信息学数据库分为: 核酸、 蛋白质、 基因图谱、 结构、 文献等数据库 第五页,共三十四页,2022年,8月28日 第二节 核酸序列数据库 一、GenBank数据库 GenBank 是一个综合数据库,该数据库中包含了已经公开的260000余种不同物种生物的核酸序列,这些数据主要是由全世界不同实验室和大规模测序计划提交给GenBank的。 第六页,共三十四页,2022年,8月28日 GenBank是具有目录和生物学注释的核酸序列综合数据库, 由美国国家医学图书馆(NLM)的国家生物技术信息中心(NCBI)构建、维护和管理。该中心位于美国马里兰国家健康研究所(NIH)。NCBI构建GenBank数据库的序列数据来至序列发现者提交的序列、批量提交的表达序列标签(EST)、基因组测序序列(GSS)和其它测序中心的高通量数据,以及美国专利商标局提供的已发表专利的序列数据。 第七页,共三十四页,2022年,8月28日 GenBank、EMBL、DDBJ组成国际核酸序列数据库合作组织(INSDC),该组织成员远程合作,每天相互交换数据以保证序列信息的一致性和完整性。 第八页,共三十四页,2022年,8月28日 检索GenBank数据 Entrez检索系统 BLAST 序列相似性搜索程序 用FTP获取GenBank 数据库 第九页,共三十四页,2022年,8月28日 Entrez系统 使用Entrez()可以访问GenBank中的序列记录,Entrez是一个灵活的数据库检索系统,可以检索35个数据库。Entrez数据库包含来源于GenBank和其它资源的DNA和蛋白序列,还包括基因组图谱、种群、进化和环境序列序列数据集、基因表达数据、NCBI分类学、蛋白结构域信息和来源于Molecular Modeling Database(MMDB)的蛋白结构数据库,每个数据库经由PubMed和PubMed Central与学术文献关联。 第十页,共三十四页,2022年,8月28日 BLAST 序列相似性搜索 序列相似性搜索是GenBank数据最基本和使用最多的分析方式。NCBI提供BLAST()系列程序检测一条查询序列与数据库所有序列的相似性。BLAST搜索可以在NCBI网站上运行,也可以在FTP站点下载独立的程序集运行。 第十一页,共三十四页,2022年,8月28日 用FTP获取GenBank NCBI以传统的纯文本文件格式发布GenBank,还以ASN.1格式用以内部维护。通过NCBI匿名FTP ()站点可以获得每两个月的全文公告和每天与EMBL和DDBJ数据更新内容,还可以从印第安纳大学的镜像站点(/biomirror/genbank/)下载。在“genbank”目录中的“daily-nc”文件夹中可以获得纯文本的更新数据压缩文件。在GenBank FTP站点的“tools”目录中提供转换每日更新数据集的脚本。 第十二页,共三十四页,2022年,8月28日 EMBL数据库 EMBL核苷序列数据库()是欧洲主要的核苷序列收集单位。这个数据库是由欧洲生物信息中心EBI(欧洲分子生物学实验室(EMBL)在德国海德堡的站点)维护的。 第十三页,共三十四页,2022年,8月28日 EBI核苷数据来自基因组测序中心、个别科学家、欧洲专利局、以及与合作伙伴DDBJ (Japan)和GenBank (USA)交换的数据。为了达到最佳的同步性,每天DDBJ/EMBL/GenBank之间都要交换最新的数据。用户只要进入三者中任意一个数据库都能得到最新数据。这三个数据库之间坚持统一的文件指导方针,规范了数据库登录的内容和语

文档评论(0)

lan0001 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档