- 40
- 0
- 约1.05万字
- 约 86页
- 2019-09-07 发布于湖北
- 举报
生物信息学 Initial exon:初始外显子 Internal exon:内部外显子 Terminal exon:终端外显子 Single-exon gene:单外显子基因 Promoter:启动子 Poly-A signal: Poly-A点 DNA的负链,能编码蛋白质,合成RNA的模板 DNA的正链就是与mRNA序列相同的那一个DNA单链,只不过U代替了T。 DNA的正、负链是互补的。 蛋白质序列分析 蛋白质序列分析与结构预测 主要内容 一、蛋白质性质预测 二、蛋白质结构预测 三、蛋白质结构3D视图观察 一、蛋白质性质预测 1,Compute pI/Mw /tools/pi_tool.html Compute pI/Mw is a tool which allows the computation of the theoretical pI (isoelectric point) and Mw (molecular weight) for a list of UniProt Knowledgebase (Swiss-Prot or TrEMBL) entries or for user entered sequences 。 序列 结果 2,ProtParam tool 可预测参数 输入序列:NP_002779 结果 蛋白质的鉴定 3,AACompIdent tool /tools/aacomp/ About 输入的数据 AACompIdent tool 输入界面 结果 4,信号肽预测工具 真核生物基因的一般结构示意图 SignalP-信号肽预测工具 http://www.cbs.dtu.dk/services/SignalP/ 序列数据 图形显示 data 序列NP_002779 5,跨模结构分析 跨膜结构一般在蛋白质结构中序列的相似性不大,但结构却极其相似,因此在序列搜索中可能没有很显著的结果,所以常用的BLAST之类的相似性或者同源性搜索就无效。 TMpred /software/TMPRED_form.html 算法简介 序列 结果 6,卷曲螺旋预测 卷曲螺旋是控制蛋白质寡聚化的元件 这种结构中的两个螺旋通过其疏水性界面相互缠绕在一起形成一个十分稳定的结构 /software/COILS_form.html 7,糖基化位点预测 http://www.cbs.dtu.dk/services/NetNGlyc/ The NetNglyc server predicts N-Glycosylation sites in human proteins using artificial neural networks that examine the sequence context of Asn-Xaa-Ser/Thr sequons. 二、蛋白质结构预测 蛋白质结构预测问题 序列——结构——功能 结构预测问题 解决方法 寻找一种从蛋白质的氨基酸线性序列到蛋白质所有原子三维坐标的一种映射 蛋白质序列: ↓ 二级结构 二级结构预测 1)二级结构预测概述 预测方法 预测方法发展 预测方法发展 2)蛋白质二级结构预测方法 可供参考的一些原则 可供参考的一些原则 Chou-Fasman方法 公式 例 数据库1000个残基,300个处于α,其中残基A有100个,这100个残基中处于α的有75个,则A对α的倾向性因子 课堂练习 假定数据库中有1830个残基, 780个处于螺旋态,1050个处于非螺旋态,库中共有390个丙氨酸(A),有240个A处于螺旋态,其余150个 A 处于非螺旋态。计算丙氨酸的α的P值。 发现关于二级结构的经验规则 (i)α螺旋规则 (ii)β折叠规则 (2) GOR方法 是一种基于信息论和贝叶斯统计学的方法 GOR将蛋白质序列当作一连串的信息值来处理 GOR方法不仅考虑被预测位置本身氨基酸残基种类的影响,而且考虑相邻残基种类对该位置构象的影响 (3)Lim方法——立体化学方法 α螺旋的形成规律 对于β折叠的形成规律: (4) 同源分析法 (5) 人工神经网络方法 3)利用进化信息预测蛋白质的二级结构 giref|NP_006735.2| retinol-binding protein 4, plasma precursor [Homo sapiens] MKWVWALLLLAALGSGRAERDCRVSSFRVKENFDKARFSGTWYAMAKKDPEGLFLQDNIVAEFSVDETGQ MSATAKGRVRLLNNWDVCADMVGTFTDTEDPAKFKMKYWGVASFLQKGNDDHWIVDTDYDTYAVQYSCR
原创力文档

文档评论(0)