第三章分子生物信息数据库(中北大学).pptVIP

第三章分子生物信息数据库(中北大学).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章分子生物信息数据库(中北大学).ppt

第三章:分子生物信息数据库 第一节:模式生物简介 第二节:分子生物数据库简介及分类 第三节:基因组数据库 第四节:序列数据库 第五节:结构数据库 第六节:二次数据库 第一节:模式生物简介 模式生物(Model organism)是指受到广泛研究,对其生物现象有深入了解的物种。 生物学家通过对选定的生物物种进行科学研究,用于揭示某种具有普遍规律的生命现象 它们为什么会被选中? 共同的特点: 1)有利于回答研究者关注的问题,能够代表生物界的某一大类群; 2)对人体和环境无害,容易获得并易于在实验室内饲养和繁殖; 3)世代短、子代多、遗传背景清楚; 4)容易进行实验操作,特别是具有遗传操作的手段和表型分析的方法。 模式生物的分类: 小 小家鼠 小巢状曲菌 拟 拟南芥 斑 斑马鱼 目前在人口与健康领域应用最广的模式生物包括,噬菌体、大肠杆菌、酿酒酵母、秀丽隐杆线虫、海胆、果蝇、斑马鱼、爪蟾和小鼠。 在植物学研究中比较常用的有,拟南芥、水稻等 第二节:分子生物数据库简介及分类 面对大量的生物信息数据库,必须采取有效的方法,数据管理技术大致分为3种形式:手工管理、文件系统和数据库。 数据库:利用计算机对数据进行存储和管理(广义);核酸和蛋白质序列数据的计算机处理和分析(狭义);利用计算机和网络技术来解决生物学问题(实质)。 二次数据库种类很多,以核酸数据库为基础构建的有:TransFac(基因调控转录因子数据库)、EPD(真核生物启动子数据库)、Vector(克隆载体数据库)、CUTG(密码子使用表数据库);以蛋白质序列为基础的构建的:Prosite、Prints、Blocks等。 第三节:基因组数据库 基因组数据库是分子生物信息数据库的重要组成部分,其主体是模式生物基因组数据库,即是前面所讲的。 除了模式生物基因组数据库外,还包括染色体、基因突变、遗传疾病、分类学、比较基因组等各种数据库。 基因组数据库不仅需要便于存储和分析的大量数据,还必须有友好的界面,现在还没有普遍认同的基因组数据库格式。 第四节:序列数据库 的种类 一、核酸序列数据库 数据库包括两类:核酸与蛋白质序列数据库,以顺序为基本内容,注释信息包括两部分:一部分由计算机经分析生成,另一部分依靠生物学家通过查询文献资料获得。 国际上权威的核酸序列数据库 美国生物技术信息中心的GenBank / 欧洲分子生物学实验室的EMBL http://www.ebi.ac.uk 日本遗传研究所的DDBJ http://www.ddbj.nig.ac.jp/ 二、常用蛋白质序列数据库 PIR数据库 蛋白质序列测定技术先于DNA技术问世,蛋白质序列的收集也早于DNA序列。1984年“蛋白质信息源”PIR计划正式启动,蛋白质序列数据库也因此而诞生。 目的: 帮助研究者鉴别和解释蛋白质序列信息,研究分子进化、功能基因组。 它是一个全面的、经过注释的、非冗余的蛋白质序列数据库。 所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。 除了蛋白质序列数据之外,PIR还包含以下信息: (1)蛋白质名称、蛋白质的分类、蛋白质的源; (2)关于原始数据的参考文献; (3)蛋白质功能和蛋白质的一般特征,包括基因表达、翻译后处理、活化等; (4)序列中相关的位点、功能区域。 2、SWISS-PROT数据库 SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护,数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释特别详细,包括结构域、功能位点、跨膜区域、二硫键位置、翻译后修饰、突变体等。 SWISS-PROT采用了和EMBL核酸序列数据库相同的格式和双字母标识字。 SWISS-PROT是目前国际上比较权威的蛋白质序列数据库,其中的蛋白质序列是经过注释的。 SWISS-PROT中的数据的来源: (1)从核酸数据库经过翻译推导而来; (2)从蛋白质数据库PIR挑选出合适的数据; (3)从科学文献中摘录; (4)研究人员直接提交的蛋白质序列数据。 SWISS-PROT有三个明显的特点: 3、其他蛋白质序列数据库 TrEMBL (http://www.ebi.ac.uk/trembl/index.html) 是与SWISS-PROT相关的一个数据库。 包含从EMBL核酸数据库中根据编码序列(CDS)翻译而得到的蛋白质序列,并且这些序列尚未集成到SWISS-PROT数据库中。 TrEMBL有两个部分: (1)SP-TrEMBL(SWISS-PROT TrEMBL) 包含最终将

文档评论(0)

love + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档