生物信息学分析方法的研究.ppt

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学分析方法的研究

(1)BLAST和FASTA FASTA(http://www.ebi.ac.uk/fasta33/) BLAST(/BLAST/) 是目前运用较为广泛的相似性搜索工具。这两个工具都采用局部比对的方法,选择计分矩阵对序列计分,通过分值的大小和统计学显著性分析确定有意义的局部比对。其中BLASTN、BLASTP在实践中最为常用,TBLASTN在搜索相似序列进行新基因预测时特别有用。 (一)、ORF(Open Reading Frame)分析 (二)、染色体定位 (三)、基因结构分析 (四)、基因上游调控区分析 (一)、ORF(Open Reading Frame)分析 ORF,即开放阅读框,是DNA上的一段碱基序列,由于拥有特殊的起始密码子和直到可以从该段碱基序列产生合适大小蛋白才出现的终止密码子,该段碱基序列可以编码一个蛋白。 从核酸序列翻译得到蛋白质序列,需要进行ORF分析,每个生物信息学分析软件包几乎都带有翻译功能。推荐使用NCBI的ORF Finder(/ gorf/gorf.html)软件或EMBOSS中的getorf(http://bioinfo.pbi.nrc.ca:8090/EMBOSS)软件。ORF Finder 以图形方式,分为正链+1、+2、+3和反链+1、+2、+3六个相位预测ORF;Getorf可指定预测ORF的长度下限和指定预测正反链。 (二)、染色体定位 根据基因组图谱对序列进行染色体定位和浏览其基因组上下游基因。 具体方法为: (1)进行Genomic BLAST搜索。 (2)通过Genome view观察基因组结构。 (3)点击相应染色体区域,通过表意图(ideogram)和 相应区域上下游的基因进行精确定位。 (三)、基因结构分析 由于真核生物转录后内含子将被剪切,因此将mRNA和基因组进行比对以后,会发现mRNA的每个外显子与基因组序列片断匹配,根据这些片段可以判断外显子的数目和大小。外显子和内含子具体边界的确定,可以参考GT/AG一致性规则。BLAT的结果直接显示外显子数目、大小及边界。 根据基因的mRNA序列及基因组序列,可以进行基因结构的分析。推荐使用BLAST或BLAT(/ cgi-bin/hgBlat?command=start)进行分析。 (四)、基因上游调控区分析 (1)启动子预测:用RT-PCR等实验方法获得的mRNA往往缺少完整的5’端,采用FirstEF 程序可以对第一外显子(尤其是非编码的第一外显子)和CpG相关启动子进行预测。 推荐使用冷泉港开发的FIRSTEF程序(/tools/FirstEF/)进行启动子预测。 (2)转录因子结合位点分析:推荐使用TFSEARCH程序(http://www.cbrc.jp/research/db/TFSEARCH.html)及MATCH程序 (/pub/ programs.html#match)对转录因子数据库TRANSFAC(http://transfac.gbf.de/TRANSFAC/)进行搜索,寻找可能的转录因子结合位点。 (一)、跨膜区预测 (二)、信号肽预测 (三)、亚细胞定位预测 (一)、跨膜区预测 各个物种的膜蛋白的比例差别不大,约四分之一的人类已知蛋白为膜蛋白。由于膜蛋白不溶于水,分离纯化困难,不容易生长晶体,很难确定其结构。因此,对膜蛋白的跨膜螺旋进行预测是生物信息学的重要应用。 ? ? 推荐使用TMHMM软件(http://www.cbs.dtu.dk/services/ TMHMM/)对蛋白进行跨膜预测。TMHMM综合了跨膜区疏水性、电荷偏倚、螺旋长度和膜蛋白拓扑学限制等性质,采用隐马氏模型(Hidden Markov Models),对跨膜区及膜内外区进行整体的预测。TMHMM是目前最好的进行跨膜区预测的软件,它可以区分可溶性蛋白和膜蛋白,因此首选它来判定一个蛋白是否为膜蛋白。 (二)、信号肽预测 信号肽位于分泌蛋白的N端,当蛋白跨膜转移位置时被切掉。信号肽的特征是包括一个正电荷区域、一个疏水性区域和不带电荷但具有极性的区域。 推荐使用SignalP软件2.0版(http://www.cbs.dtu.dk/ services/SignalP-2.0/)对蛋白质N端序列进行信号肽分析。SignalP2.0根据信号肽序列特征,采用神经网络方法或隐马氏模型方法,根据物种的不同,分别选择用真核和原核序列进行训练,对信号肽位置及切割位点进行预测。 (三)、亚细胞定位预测 亚细

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档