- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
iProclass - 生物信息学
*计算机应用作业
iProclass:一个涉及蛋白质家族,功能与结构信息的综合数据库
(姓名:陈莉黎 学号:021402139 专业:02级生物技术)
摘要:
iProclass数据库提供了蛋白质完整的、附加值的描述,在分布的网络环境中作为完整数据的一部分。iProclass数据库中的蛋白信息包括家族联系、结构、功能性的分类和特征。它包括PIR-PSD、SWISS-PROT、TREMBL中的超过36000条PIR超家族、145000个家族、4000个区、1300结构框、550000FASTA相似群等共830000条非冗余蛋白,它与50多个涉及蛋白序列家族、功能、途径、蛋白-蛋白联系、转录后修饰、蛋白表达、结构、功能分类、基因、基因组、本质、文献和分类的数据库有很强的连接。蛋白与超家族总结信息包括许多附加的注释信息以及包括区域和元件的成员之间的统计和图解显示。iProclass采用开放的模块化结构以提高协同性和可测性。它是用oracle对象程序数据库实现的,每两周更新一次。数据库可以通过/iproclass/免费进入,能通过序列或文本形式进行查找。iProclass中完整的数据提高了蛋白联系的探讨,它是了解蛋白进化、结构、功能的基础,对于功能基因组学和蛋白质学的研究是必要的。
引言:
大量人类基因组测序的完成标志着生物研究一个新领域的开始,在科研工作者通过资源共享的基因组学、转录组学、蛋白质组学来研究生物体的基础上系统的探讨了基因功能以及其他的复杂调控过程。随着分子数据的急速积累,须用高级的生物信息学基本结构来全面的探讨有用的数据,提出新的假说和获得新的科学知识。主要的挑战在于数据容量、数据复杂度以及数据动态变化的特性。因为这些数据来源于不同的地方,维护方式也不相同。iProclass数据库主要在于能够提供一个完整的、复杂的蛋白信息网来利于知识的发现。
综述与当前内容:
iProclass数据库(图1)包括蛋白的附加值描述,包括整体(超家族/家族)和局部(区域、元件、位点)层次上的家族联系,同时也包括结构和功能分类和特征。此数据库于2000年10月公布,包含着PIR蛋白序列数据库和SWISS-PROT数据库中的200000蛋白序列,每两周更新一次。最近包括从PIR-PSD、SWISS-PROT、TREMBL数据库中的830000条非冗余的蛋白序列。这个蛋白质数据库包括多于36000条的PIR超家族、145000个家族、3700Pfam和PIR同源区、1300ProSite元件、550000FASTA同源簇,还与50多个分子生物学数据库超连接。
iProClass中的相互参考的数据通过超链接进行连接,包括连接信息以及相应的综述信息,这种方法能高效的把数据库和超文本方法结合在一起进行数据整合以从分化的资源中及时地提供资源信息。iProClass从自身的或相连的数据库中获得信息,如蛋白质序列数据库(PIR-PSD,PIR-NREF,SWISS-PROT, TrEMBL ,
GenPept, RefSeq),家族库(InterPro, Pfam, ProSite, Blocks, Prints, COG, MetaFam, PIR-ASDB, ProClass)、功能与途径库(EC-IUBMB,KEGG,BRENDA,WIT,MetaCyc,
EcoCyc)、联系库(DIP,BIND),转录后修改库(RESID,PhosphoSiteDB),蛋白表达与蛋白质组学库(PMG),结构和结构分类库(PDB,PDBSum,SCOP,CATH,FSSP,MMDB),j基因与基因组库(GenBank, EMBL, DDBJ, LocusLink, TIGR, SGD, FlyBase, MGI, GDB, OMIM, MIPS, GenProtEC), ontologies(GO),文献库 (PubMed)和分类库(NCBITaxonomy).信息内容通过以下方式持续增加:1)与更多的数据库连接2)从相连的数据库中增加强的综述信息3)增加连接到iProClass的其它数据库的机会,从多个数据库中收集到的文字注释得益于优先的数据库。
iProClass对蛋白序列以及超家族以两种综述报告的形式详细的进行诠释。蛋白序列报告涵盖了家族、结构、功能、基因、遗传、疾病、本质、分类、文献的信息,以及与互相参考相应的分子数据库和强的综述信息,也包括了区域与元件序列区的图表显示,以及还没有经过计算机处理的FASTA簇的相应序列的连接。超家族报告提供了含有长度、分类和关键字统计的PIR超家族中的成员,被分成几个主要区域的全部成员列表,与其他分类比较直接作图而获得的在整个蛋白、区域、元件水平上的家族间的联系,结构和功能参考,成员间的区域以及元件结构图示以及通过
您可能关注的文档
- 3D U+P CMOS 光学鼠标单芯片.PDF
- 39章节建议时数4-1半导体的发现及其应用2节4-2人造光与雷射2节.PDF
- 3M特种电气胶带.PDF
- 3W RA95 LED 灯珠技术规格 - LEDinside.PDF
- 3、静电影响(静电造成的测量值偏差).PDF
- 3、角变形与旋转运动.PPT
- 3冯谖客孟尝君.PPT
- 3卢瑟福原子模型.PPT
- 3在该队员与对方球门线之间.PPT
- 3接口方式与通信协议.DOC
- 高校教师资格证之《高等教育心理学》自我提分评估含答案详解(b卷).docx
- 高校教师资格证之《高等教育心理学》自我提分评估含答案详解(研优卷).docx
- 高校教师资格证之《高等教育心理学》自我提分评估含答案详解(典型题).docx
- 小型引调水工程技术方案.docx
- 生物●湖北卷丨2023年湖北省普通高中学业水平选择性考试生物试卷及答案.docx
- 新能源企业2025年碳资产管理与节能减排协同发展报告.docx
- 智能安防系统设计与实施策略报告.docx
- 高校教师资格证之《高等教育心理学》自我提分评估含答案详解(实用).docx
- 提升建筑精细化设计水平的现状及总体形势.docx
- 智能安防系统设计与实施研究报告.docx
文档评论(0)