- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
结构基序预测蛋白质功能.ppt
基础知识汇报 在类的合并上,主要有三种算法来确定类间的距离:单一连锁(single-linkage)、完全连锁(complete-linkage)和平均连锁(average-linkage)。这三种算法在定义类间的距离时分别取两类间的最小距离、最大距离和平均距离。前两种算法对边缘值太过敏感,对于未知的元素分布,一般采用平均连锁算法。 完全连锁(complete linkage),又称最远邻(furthest neightbour)方法。同样从相似度矩阵或距离矩阵出发,但定义距离为两类之间数据的最大距离。同样不考虑到类的结构。倾向于找到一些紧凑的分类。 以最小近邻法聚类为例 最短距离聚类法具有空间压缩性,而最远距离聚类 法具有空间扩张性。最短距离为 dAB=da1b1,最远 距离为 dAB=dap2。 Composite Structural Motifs of Binding Sites for Delineating Biological Functions of Proteins 汇报人:刘言 简介 在原子水平上,我们都是通过蛋白质之间或蛋白 质与其他分子之间相互作用来理解生物学过程的。 大部分蛋白质会同步或不同步的与很多分子相互 作用。 单原子离子,小分子到蛋白质、核酸和其他大分子 众所周知,蛋白质相互作用的类型和蛋白质是否 相互作用可以调节蛋白质的功能(血红蛋白与氧结 合,与一氧化碳结合)。因此,我们不仅要确定个 体蛋白的相互作用,也要考虑潜在的蛋白质相互作 用,这些相互作用或许可以充分描述蛋白质的功 能,也能从同源蛋白中区分它们的不同功能。 Genome sequence technologies促使我们更加急迫 的去发掘从序列信息预测蛋白质功能的有效技术。迄 今为止,最常用于蛋白质功能预测的方法是 annotation transfer,它是基于一种蛋白质序列相似, 功能相似的假设基础上的方法。然而,随着研究的 逐步深入,这种方法在很多情况下却是不可靠的。 蛋白质功能相似,并不仅仅是序列功能的相似。蛋白质序列折叠方式不同,会导致结构不同,从而影响功能。所以我们要更加精细的检查蛋白质功能的决定因素,而不是只单纯的考虑蛋白质序列相似性。 结构信息可以为蛋白质功能预测提供更加准确的信 息。 To date, there have been many methods for detecting potential ligand binding sites based on structural similarity of proteins [14,16–22]. Most of these methods are targeted at predicting protein functions at the level of ligand binding and catalytic activity. There have also been many studies on protein-protein interaction interfaces to understand biological functions of proteins in cellular contexts 。 然而,大部分研究都是针对于一些特殊的相互作用本身和不明确机理的相互作用如何调控蛋白质的生物学功能的。 文中思想 为了明确原子水平上蛋白质相互作用的模式与其功能的关系,在这里我们采用一个非常详尽的all-against-all structural comparisons of binding site structures at atomic level using all structures available in the Protein Data Bank (PDB) 。 1. Identification of elementary and composite motifs 首先,我们找到PDBML file 中所有有注释的生物学单元,然后从中提取出197690个蛋白质亚基(这些亚基均至少包含一个配体结合位点) 这里,我们把一个亚基的配体结合位点定义为一个亚基的原子集(与配体原子的距离在5A之内)。然而我们不用已知的基于序列相似性的非冗余数据库,我们的冗余在相似结构聚类之后再清理。通过这种方式,确定在后续的分析中当结构冗余条件移除后高度相似的蛋白质结构差异或相同的氨基酸序列是否能够preserved。 Kinjo AR, Nakamura H (20
文档评论(0)