第2讲生物信息数据库.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* DBCat中各类数据库个数 * *   在SWISS-PROT中,数据分为核心数据和注释两大类。   核心数据包括:   序列数据、参考文献、分类信息(蛋白质生物来源的描述) (1)注释 * Identification,序列的标识符行; Accession number,登录号行; Description,序列描述行; Organism species,描述生物体种属; Organnism classification, 描述生物体分类信息; Reference number,描述参考文献的编号; Reference authors,描述参考文献的作者; Reference title,描述 参考文献的题目; Reference location,描述参考文献的出处; Gene name,基因名称; Date,创建和更新日期行; Reference position,参考文献涉及内容; Cross-references,参 考文献的MEDLINE号; * * 注释包括: (A)蛋白质的功能描述;(B)特殊位点和区域 ,如钙结合区域、ATP结合位点等; (C)与其它蛋白质序列的相似性;(D)序列残缺与疾病的关系; * (2)最小冗余 尽量将相关的数据归并,降低数据库的冗余程度。 如果不同来源的原始数据有矛盾,则在相应序列特征表中加以注释。 (3)与其它数据库的连接 对于每一个登录项,有许多指向其它数据库相关数据的 指针,这便于用户迅速得到相关的信息。 现有的交叉索引有: 到EMBL核酸序列数据库的索引, 到生物大分子结构数据库PDB的索引等 。 * * (三)、 结构数据库 * 1、PDB(Protein Data Bank) PDB中含有通过实验(X射线晶体衍射,核磁共振NMR)测定的生物大分子的三维结构 蛋白质 核酸 糖类 蛋白质和核酸复合物 /pdb/ 对于每一个结构,包含名称、参考文献、序列、一级结构、 二级结构和原子坐标等信息。 * * 一种是显式序列信息(explicit sequence) 在PDB文件中,以关键字SEQRES作为显式序列标记,以该关键字打头的每一行都是关于序列的信息。 * 一种是隐式序列信息(implicit sequence) PDB的隐式序列即为立体化学数据,包括每个原子的名称和原子的三维坐标。 * 显示分子结构(RasMol , ChemView ) * 2、蛋白质结构分类数据库 SCOP (Structural Classification of Proteins) * SCOP(Structural Classification of Protein) 英国医学研究委员会分子生物学实验室和蛋白质工程中心开发的基于web的蛋白质结构数据库分类、检索和分析系统; SCOP的网址:http://scop.mrc-lmb.cam.ac.uk/scop/ * http://scop.mrc-lmb.cam.ac.uk/scop/ * * 二级数据库简介 * 二级数据库的形式:大多以web界面为基础,具有文字信息、表格、图形、图表等方式显示数据库内容; 一级数据库与二级数据库之间并无明确的界限。(例如:GDB、AceDB、SCOP、CATH等都已经具有二级数据库的特色) * 1、基因组信息二级数据库 TransFac(真核生物基因调控转录因子数据库) 德国生物工程研究所开发维护,始建于1988年。是真核基因顺式调控元件和反式作用因子数据库,数据搜集的对象从酵母到人类。 TransFac的网址: * * 2、蛋白质序列二级数据库 Prosite(蛋白质序列功能位点数据库) 始建于1990年代初,由瑞典生物信息学研究所SIB负责维护。 构建依据:通过多序列比对方法,得到的保守性区域,如酶的催化位点、配体结合位点、与金属离子结合的残基。 蛋白质序列功能位点数据库。 (/prosite/) * * DSSP(http://www.sander.embl-heidelberg.de/dssp/) 对生物大分子数据库PDB中的任何一个蛋白质,根据其PDB中的原子坐标,计算氨基酸残基的二级结构构象参数。 3、蛋白质结构二级数据库 * The DSSP code H = alpha helix B = residue in isolated beta-bridge E = extended strand, participates in

文档评论(0)

zyg_2930102 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档