- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质结构分析原理及工具
(南京农业大学生命科学学院 生命基地111班)
摘要:本文主要从相似性检测、一级结构、二级结构、三维结构、跨膜域等方面从原理到方法再到工具,系统地介绍了蛋白质结构分析的常用方法。文章侧重于工具的列举,并没有对原理和方法做详细的介绍。文章还列举了蛋白质分析中常用的数据库。
关键词:蛋白质;结构预测;跨膜域;保守结构域
1 蛋白质相似性检测
蛋白质数据库。由一个物种分化而来的不同序列倾向于有相似的结构和功能。物种分化后形成的同源序列称直系同源,它们通常具有相似的功能;由基因复制而来的序列称为旁系同源,它们通常有不同的功能[1]。因此,推测全新蛋白质功能的第一步是将它的序列与进化上相关的已知结构和功能的蛋白质序列比较。表一列出了常用的蛋白质序列数据库和它们的特点。
表一 常用蛋白质数据库
数据库 说明 链接 蛋白序列数据库 GenPept Translations of GenBank coding nucleotide entries /Genbank/ PIR International protein database / RefSeq Curated, non-redundant with expert annotation /RefSeq/ UniProt/SwissProt Reviewed, manually annotated entries /help/uniprotkb UniProt/TrEMBL Automatically classified and annotated entries /help/uniprotkb 蛋白质分类数据库 CATH Proteins classified based on class, architecture, topology and homology / SCOP Structural classification of proteins http://scop.mrc-lmb.cam.ac.uk/scop ProtClustDB Proteins classified based on sequence similarity /proteinclusters 蛋白质结构数据库 PDB Resolved 3D biomolecular structures /pdb 网址可能有更新
氨基酸替代模型。进化过程中,一种氨基酸残基会有向另一种氨基酸残基变化的倾向。氨基酸替代模型可用来估计氨基酸替换的速率。目前常用的替代模型有Point Accepted Mutation (PAM)矩阵、BLOck SUbstitution Matrix (BLOSUM)矩阵[2]、JTT模型[3]。
序列相似性搜索工具。序列相似性搜索又分为成对序列相似性搜索和多序列相似性搜索。成对序列相似性搜索通过搜索序列数据库从而找到与查询序列相似的序列。分为局部联配和全局联配。常用的局部联配工具有BLAST和SSEARCH,它们使用了Smith-Waterman算法。全局联配工具有FASTA和GGSEARCH,基于Needleman-Wunsch算法。多序列相似性搜索常用于构建系统发育树,这里不阐述。表二列举了常用的成对序列相似性比对搜索工具
表二 成对序列相似性比对搜索工具
工具 说明 链接 BLAST Basic local alignment search tool /Blast.cgi FASTA Global alignment search tool; http://www.ebi.ac.uk/Tools/fasta33/ GGSEARCH Global alignment search tool http://www.ebi.ac.uk/Tools/fasta33/
index.html?program=GGSEARCH SSEARCH-Protein Local alignment search tool against proteins http://www.ebi.ac.uk/Tools/fasta33/
index.html?program=SSEARCH 网址可能有更新
2 蛋白质一级结构分析(含保守结构域)
蛋白质结构的基本信息来源于它的一级结构,分析蛋白质一级结构的第一步是将它们分成其组成部分,然后处理每个部分的结构[4]。这种拆分常常是根据蛋白质具有的相互作用的结构域进行的[5, 6]。蛋白质结构域或蛋白质家族数据库对分析未知蛋白质的功能是很有用的,这些数据库通常被称为“特征数据库(signature databases)”。“基序(Motifs)”通常指没有间隔的多序列队列,通常由10-20个氨基酸
您可能关注的文档
最近下载
- 最新人教版六年级数学上册教案全册.doc VIP
- 《中华民族大团结》(初中)第10课伟大梦想共同追求教案.pdf VIP
- 中外教育理论名著选读.docx VIP
- 专业音响完整系统的安装与调试.doc VIP
- 西门子12001500PLC用触摸屏按钮触发启动PID的自整定编写方法程序示例.docx VIP
- 《中外教育名著选读》模拟试题.docx VIP
- 中兴接入网和epon b ch zxa10f822产品介绍23p.pdf VIP
- 平型关大捷和台儿庄战役.ppt VIP
- 环境学第2版-左玉辉-教学课件-第2讲 水环境.ppt VIP
- 小米质量保证工程师岗面试题库参考答案和答题要点.docx VIP
文档评论(0)