生物信息学论文.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学论文 学院:生命科学技术学院 专业:生物科学 班级:2013级 老师:高亚梅 学生:王秉政 学号:20134083038 黑曲霉GH75及米曲霉GH76-5基因生物信息学分析 王秉政(黑龙江八一农垦大学,生命科学技术学院,2013级生物科学专业,黑龙江省,大庆市) 【摘要】目的:分析和预测黑曲霉GH75和米曲霉GH76-5基因及其编码蛋白质的结构和特征。方法:利用NCBI、CBS和ExPASy网站中的各种信息分析工具,并结合VectorNTIsuite8.0生物信息分析软件包,分析预测黑曲霉GH75和米曲霉GH76-5基因并预测该基因编码蛋白结构的特征和功能。结果:GH75基因全长174bp,编码区具有57个氨基酸,在GenBank同源序列中,其与Aspergillus niger contig An04c0140, genomic contig基因α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是11.07%、25.41%、63.52%,1个GTPase结构域。GH75蛋白为亲水蛋白,有跨膜区,有信号肽。GH76-5基因全长309bp,编码区具有102个氨基酸,在GenBank同源序列中,其与Aspergillus niger contig An14c0130, genomic contig基因α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是26.90%、20.71%、52.38%,2个GTPase结构域。GH76-5蛋白为疏水蛋白,无跨膜区,无信号肽。结论:成功预测GH75和GH76-5基因及其编码蛋白生化及其结构特征,为下一步对其进行克隆和表达奠定基础。 【关键词】黑曲霉、米曲霉;糖基水解酶家族();糖基水解酶家族()4990860.,NCBI的登录号为XM_001401782.1.?,其他物种的GH75的氨基酸序列均来自Genbank,登录号见图1。GH76-5基因编号为4987208.,NCBI的登录号为XM_001400940.2.?,其他物种的GH76-5的氨基酸序列均来自Genbank,登录号见图2。 1.2方法 利用美国国家生物技术信息中心(NCBI,)的基本局部比对搜索工具(BLAST,/blast/),运用Blastx完成基因同源性分析。 应用ORF finder(/gorf/orfig.cgi)寻找其开放读码框,并推导出可编码蛋白序列。 利用保守结构域(/Structure/cdd/wrpsb.cgi)分析预测其保守域。 通过瑞士生物信息学研究所的蛋白分析专家系统(ExPASy,)所提供的蛋白组学和分析工具:Protparam程序分析GH75及GH76-5蛋白氨基酸组成、相对分子质量、等电点等基本理化性质;TMHMM程序预测GH75及GH76-5的跨膜区;Proscale程序分析GH75及GH76-5的蛋白性质;SignalP程序预测GH75及GH76-5蛋白的信号肽,GOR超链接分析GH75及GH76-5的二级结构,SWISS-MODEL通过二级结构比对和折叠,模拟蛋白质的空间构象。 利用SMART(http://smart.embl-heidelberg.de/)分析预测其结构域。 结果 2.1基因序列的分析 BLASTx分析结果表明,GH75与多个物种的GH5基因同源,其中与Aspergillus niger contig An04c0140, genomic contig的同源性最高,一致性达100%,相似度达99%(图1)。ORF Finder获得其开放阅读框编码氨基酸序列,该基因全长174bp,编码区为2-174bp,编码57个氨基酸,无起始密码子,终止密码子TAA,不编码蛋白(图3)。CCD分析发现有GH75保守域。 BLASTx分析结果表明,GH76-5与多个物种的GH6基因同源,其中与Aspergillus niger contig An14c0130, genomic contig的同源性最高,一致性达100%,相似性达100%(图2)。ORF Finder获得其开放阅读框编码氨基酸序列,该基因全长309bp,编码区为1-308bp,编码102个氨基酸,无起始密码子,终止密码子TGA,不编码蛋白(图4)。CCD分析发现有GH76-5保守域。 2.2编码蛋白的特征分析 2.2.1蛋白质的基本参数 GH75蛋白相对分子量预测为26257.2,理论等电点为4.69,脂肪系数为75.94。在溶液中的不稳定系数是25.26,为稳定蛋白。当蛋氨酸在N端时,可预测其在哺乳动

您可能关注的文档

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档