- 1、本文档共118页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学2-蛋白质分析
蛋白质分析 认识蛋白质的四个视角 蛋白质家族 蛋白质的物理性质 蛋白质的细胞定位 蛋白质的生物学功能 视角1:蛋白质家族 Signature 多结构域蛋白的分析 BLAST的特殊应用之一 利用PHI-BLAST 基于Motif ASP_PROTEASE 的系统发育分析 视角2:蛋白质的物理性质 等电点:通过等电聚焦实验得到 分子量:通过分子半径和沉降系数得到 磷酸化位点:酶分析 糖基化位点:酶分析 跨膜区结构域:亚细胞成分分离 较为常用的软件、网站 DNAMAN6 DNASTAR7 http://www.expasy.ch/tools/#proteome 螺旋卷曲结构的预测 蛋白质分析的巨无霸 蛋白序列分析软件包ANTHEPROT?6.0,包括了蛋白质研究领域所包括的大多数内容,功能非常强大。应用此软件包,使用个人电脑,便能进行各种蛋白序列分析与特性预测,包括:进行蛋白序列二级结构预测;在蛋白序列中查找符合PROSITES数据库的特征序列;绘制出蛋白序列的所有理化特性曲线;在Internet或本地蛋白序列数据库中查找类似序列;计算蛋白序列分子量,比重与各蛋白残基百分组成;计算蛋白序列滴定曲线与等电点;选定一个片段后,绘制Helical?Wheel图;进行点阵图(Dot?Plot)分析;计算信号肽潜在的断裂位点等功能。 MAOA(单胺氧化酶A)基因启动子区可变串联重复序列数目 与反社会人格障碍攻击行为有关 ccggcaccggca AJ004833 在基因组数据库中检索人的MAOA基因 MAOA的基因区间43491011 MAOA的启动子区间43400353 CCGGCACCGGCA /enhome.asp 建立文献数据库 选择第一项,建立一个新的EndNote文献数据库 在电脑里选择一个合适的文件夹作为EndNote的数据库存放地。 进入PubMed,输入“hTERT”,选择 选择带有 图标的,这是免费全文的标志。打开可以看到 点击Reference,选择New reference,为数据库增加一篇新文献。 知道多少添多少 点击保存,ok 导入文献数据库 进入到PubMed的检索结果界面,选中目的文献 。 在dislay框中选择MEDLINE 保存为MEDLINE格式的文件 保存在数据库中 视角3:细胞定位 视角4:蛋白质功能 GOA集大成者-UniProt 9月24日,瑞士生物信息学研究所(Swiss Institute of Bioinformatics,简称SIB)蛋白质序列数据库(Swiss-Prot)小组的成员们在伯尔尼(Bern)大教堂外展开了一卷写满目前人类所知20325种人类蛋白质描述的长幅,以庆祝该研究所的10岁生日。 UniProt Knowledgebase(UniProtKB):这是蛋白质序列、功能、分类、交叉引用等信息存取中心 人类肾上腺皮质激素受体蛋白在4.5亿年的时间里发生结构变化, 最终进化出了特定的功能。 UniProtKB是标准的GOA文件,在“Search in”框中,选择“UniProt Knowledgebase(UniProtKB)”,首先是使用“search”的文本检索功能,在Query框中输入“glucocorticoid receptor human”,旨在搜索人的肾上腺皮质激素受体。 熟悉一下UniProtRef 是UniProt收录的非冗余序列集,在“Search in”框中,选择“Sequence Cluster(UniProtRef)”,首先是使用“search”的文本检索功能,在Query框中输入“glucocorticoid receptor human”,旨在搜索人的肾上腺皮质激素受体。搜索结果将给出所有符合检索条件的序列子集,以供选择,并且给出三个子集选择,分别是50%、90%、100%。也就是说,将序列以不同的相似程度进行组合,以便研究者按照自己的要求进行选择,如果需要100%相似性的选择,就意味着在可变异构体中进行,如果90%,则意味着在不同种属间进行,50%则意味去寻找远缘相关的蛋白了,如何选择,只需点击50%、90%、100%即可。 接下来进行聚类分析。点击“Align”,出现在序列框中是个该子集中的所有序列的序列号码,见下图: 比对结果 * 视角1:蛋白质家族 Domain Motif 所谓结构域是指蛋白质中能折叠成特定三维结构的一段区域。一组拥有相同结构域的蛋白被称为一个蛋白质家族。常见结构域的氨基酸残基数在100~400个之间,最小的结构域只有40~50个氨基酸残基,大的结构域可超过400个氨基酸残基。 是蛋白质中较短的保守序列,可以决定蛋白质的性质,长度一般为10-20个氨基酸,含有相同
文档评论(0)