生物信息学分析实例.docVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学分析实例.doc

实例分析: ORF预测的可靠性检验 设计引物:Primer Premier 5.0 评估引物质量:Oligo 6.65 或Oligonucleotide Properties Calculator NCBI的BLAST 2 SEQUENCES程序 /blast/bl2seq/wblast2.cgi 核苷酸序列=氨基酸序列 制作密码子用法表 蛋白质理化性质分析 在线分析 ExPasy服务器上的ProtParam /tools/protparam.html 生物学软件 BioEdit-氨基酸成分 Seqtools-亲、疏水性残基,蛋白溶解度 蛋白质功能性区域分析 疏水性分析 在线的ProtScale 程序 /cgi-bin/protscale.pl 使用生物学软件BioEdit7.05 采用Kyte-Doolittle的TGRESE算法 调整计算窗口大小n=9 ? ?附:该参数用于估计每种氨基酸残基的平均显示尺度,有助于对数据进行平滑。 跨膜区分析 在线分析 TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/ TMpred /software/TMPRED_form.html TMP http://www.mbb.ki.se/tmap/ 信号肽预测 SignalP 3.0 Server 几种人工神经网络法的组合 G+、G-、真核生物为训练集 http://www.cbs.dtu.dk/services/SignalP/ 卷曲螺旋预测 卷曲螺旋是控制蛋白质寡聚化的元件 /software/COILS_form.html 亮氨酸拉链结构:亲脂性的α螺旋,包含有许多集中在螺旋一边的疏水氨基酸,两条多肽链以此形成二聚体。每隔6个残基出现一个亮氨酸。由赖氨酸(Lys)和精氨酸(Arg)组成DNA结合区。 Domain分析 ? ?结构域是蛋白序列的功能、结构和进化单元,由50-300个氨基酸组成,有独特的空间构象。 ? ?类型:全平行结构域、反平行结构域、α+β结构域、α/β结构域及他折叠类型 EMBL的SMART服务器 http://smart.embl-heidelberg.de/ 提交序列后=系统每隔10秒刷新一次=结果 模体(Motif)搜索 PROSITE数据库 确定新的蛋白质序列是否属于已知家族 N-糖基化位点的模式(Pattern):N[^P][ST][^P] 其中^P表示除Pro外的任意氨基酸 缺点:数量与质量上存在问题 /prosite/ Profile数据库 基于最佳的多重比对质量(包括人工校正) 优点:确保重要信息不被遗漏 http://myhits.isb-sib.ch/cgi-bin/motif_scan 蛋白质二级结构预测 ? ?蛋白质二级结构是指α螺旋、β折叠、无规则卷曲(Coils)等元件 预测方法: 基于统计的预测方法,如Chou-Fasman法、人工神经网络法等 基于知识的预测方法:Lim方法、Cohen方法 混合方法:选择性合并以上提到的各种方法 预测准确率:70%,其中PHD神经网络预测的平均准确度及最佳残基的准确率分别高达72%和90% 二级结构预测的标准:PHD  / 同源模建 原理:比较模建,利用已知结构的同源蛋白建立目的蛋白的结构模型,再用理论计算方法进化优化,最终得到合理的3D模型。 关键:模板的选择 适用:同源性30%的同源蛋白质 步骤:(6步曲) 目的序列与模板序列的匹配; 根据多重比对结果确定同源蛋白质的保守区及相应的框架结构; 目的蛋白质结构保守区的主链模建; 目标蛋白质结构变异区的主链模建; 侧链的安装和优化; 优化和评估模建的结构 系统发育分析 NJ法-邻接法: 特点:NJ法是基于最小进化原理经常被使用的一种算法,它构建的树相对准确,假设少,计算速度快 ,只得一颗树。 缺点:序列上的所有位点等同对待,且所分析的序列的进化距离不能太大 适用:进化距离不大,信息位点少的短序列 MP法-最大简约法 特点:基于进化过程中碱基替代数目最少这一假说 缺点:推测的树不是唯一的,变异大的序列会出现长枝吸引而导致建树错误。 适用:序列残基差别小,具有近似变异率,包含信息位点比较多的长序列 ML法-最大似然法 原理:考虑到每个位点出现的残基的似然值,将每个位置所有可能出现的残基替换概率进行累加,产生特定位点的似然值。ML法对所有可能的系统发育树都计算似然函数,似然函数值最大的那颗树即最可能的系统发育树 优点:在进化模型确定的情况下,ML法是与进化事实吻合最好的建树算法 缺点:计算强大非常大,极为耗时 建树相关软件: PAUP-/ PHLIP-/phylip.html MEGA- T

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档