生物化学与分子生物学八年制课件.ppt

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二节 生物信息学在预测基因 功能中的应用 Bioinformatics Application in Predicting Gene Function 一、利用生物信息学方法进行基因功能注释 (一)通过序列比对预测基因功能 序列比对是生物信息学最基本的分析技术之一,最常用的方法是将目的DNA或蛋白质序列与已知的DNA和蛋白质序列数据库进行比对,搜索到与目的序列高度同源的功能已知的基因或蛋白质,用这些基因和蛋白质预测目的基因和蛋白质的功能。局部比对搜索工具BLAST是进行序列比对的基本工具,它允许用户选择一条查询序列与一个数据库进行比对,找到数据库中与输入的查询序列相匹配的项。BLAST是一个序列数据库搜索程序家族,其中包括许多有特定用途的程序。 程序 查询序列类型 数据库类型 注 BLASTN DNA DNA BLASTP 蛋白质 蛋白质 BLASTX DNA 蛋白质 将待搜索的核酸序列按6个阅读框翻译成蛋白质序列,然后与数据库中的蛋白质序列比对 TBLASTN 蛋白质 DNA 将数据库中的核酸序列按6个阅读框翻译成蛋白质序列,然后与待搜索的蛋白质序列比对 TBLASTX DNA DNA 无论是待搜索的核酸序列还是数据库中的核酸序列都按6个阅读框翻译成蛋白质序列,然后比对 BLAST序列数据库搜索程序家族 (二)利用生物信息学方法分析基因芯片数据 最常用的方法有: 差异表达分析(又称基因表达差异分析) 聚类分析 差异表达分析的目的: 识别两个条件下表达差异显著的基因,即一个基因在两个条件中的表达水平,在排除各种偏差后,其差异具有统计学意义 倍数分析:计算每个基因在两个条件下的表达比值; 统计分析中的t检验和方差分析:通过计算表达差异的置信度来分析差异是否具有统计学意义; 建模的方法:通过确定两个条件下的模型参数是否相同来判断表达差异的显著性。 差异表达分析常用的分析方法有3类: 聚类分析所依据的基本假设: 若组内基因具有相似的表达模式,则它们可能具有相似的功能,例如受共同的转录因子调控的基因,或者产物构成同一个蛋白复合体的基因,或者参与相同调控路径的基因。 在具体应用中可按照相似的表达谱对基因进行聚类,从而预测组内未知基因的功能。 目前已经有很多种聚类的方法应用到基因芯片的研究当中,如层次聚类(Hierarchical clustering)、K 均值聚类(K-means clustering)、自组织映射(self organizing map)、PCA (principlecomponet analysis)等。 在氨基酸序列整体同源性不明显的情况下,对蛋白质的功能域进行分析将对预测基因功能提供极其有价值的信息。目前已通过多序列比对将蛋白质的同源序列收集在一起,确定了大量蕴藏于蛋白质结构中的保守区域或序列,如结构域(domain)和模体(motif),这些共享结构域和保守模体通常与特定的生物学活性相关,反映了蛋白质分子的一些重要功能。 (三)通过生物信息学方法分析蛋白质 结构来预测蛋白质功能 运用蛋白质序列模体搜索工具预测蛋白质功能的方法是: 首先收集现有的蛋白质家族,构造模体数据库; 而后通过搜索该数据库确定查询序列是否具有可能的序 列模体,判断该序列是否属于一个已知的蛋白质家族; 然后根据该蛋白质家族的已知功能预测未知蛋白质的功能。 常用的模体数据库有INTERPROSCAN、PROSITE、 SMART等。 基因组功能注释常用数据库 数据库 网址 描述 AAT http : / / genome. cs. mtu. edu / aat 基因组分析和注释工具 COG http : / / www. ncbi. nlm. nih. gov / COG/ 直系同源体簇分析数据库 EcoCyc http : / / ecocyc. pangeasystems. com/ ecocyc/ ecocyc. html 大肠杆菌的基因与代谢 OMIM http : / / www. ncbi. nlm. nih. gov / Omim/ 在线人类孟德尔遗传资料 PEDENT http : / / pedant . mips. biochem. mpg. de/ frishman/ pedant . html 完整基因组的生物信息学分析 SAS http : / / www. biochem. ucl. ac. uk/ cgi2bin/ sas/ query. cgi 结构为基础的基因组序列分析 WIT http : / / www. cme. msu. edu/ WIT/ 基因

文档评论(0)

xiaohuer + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档