adhP基因生命信息结果.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
adhP基因生命信息结果

大肠杆菌K-12adhP基因的生物信息学分析 摘要 生物信息学作为一门新的学科领域,它是把基因组DNA序列HYPERLINK /view/1355865.htm信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测。大肠杆菌K-12adhP基因编码是厌氧呼吸的乙醇脱氢酶。探讨这个基因在以前实验基础上利用信息学的工具、算法预测这个基因编码序列,蛋白功能结构、和种系的发生树、多序列比对等进行研究分析,以增加对其认识。 关键词: adhP基因、生物信息学、蛋白、数据库检索、NCBI 前言 生命信息学的主要研究对象是序列,即一维的分子排列顺序的分析,包括DNA分子碱基序列和编码蛋白质的氨基酸序列。DNA序列分析的主要任务是基因识别和发现某些功能区(如启动子、增强子等)。DNA序列研究的最终目的是说明遗传语言的词法和语法规则,从而最终读懂DNA序列。蛋白质的结构预测研究始终是重要内容之一,目前研究工作是利用一级结构中的氨基酸排列顺序隐藏的信息来预测蛋白质的高级结构。而蛋白质结构研究的最终目的是阐明肽链的折叠规律。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对HYPERLINK /view/7868.htm生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。其核心是HYPERLINK /view/522657.htm基因组信息学,包括基因组信息的获取,处理,存储,分配和解释。基因组信息学的关键是读懂基因组的HYPERLINK /view/117213.htm核苷酸顺序,即全部基因在染色体上的确切位置以及各DNA片段的功能;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测。 大肠杆菌由于本身特性被作为模式生物,大肠杆菌的deK-12adhP基因编码的厌氧呼吸的乙醇脱氢酶已被认识。本文利用其它软件,从adhP基因的编码蛋白序列,功能和多序列比对,种系发生树、序列分析等反面进行探讨,使得adhP基因在生物信息学方面增加深度认识。同时提高自己对生物信息学的认识。 数据和方法 1.大肠杆菌K-12基因组数据文件的获取 先在谷歌输入NCBI→进入NCBI主页→点击NCBI FTP site→Genome Assembly/Annotation Projects(GA/AP)→Bacteria—Escherichia coli str.K_12 substr.MG1655→基因编码氨基酸选择*.faa格式、全基因组DNA序列选择*.fna、基因在基因组中的位置及编码的蛋白选择*.ptt→下载并保存结果。 2. adhP基因功能注释信息的提取 安装perl程序软件→打开并输入基因adhP→回车两次(或者回车一次直接看结果)→生成结果在基因功能的一个TXT文本中即是基因功能。 3. adhP基因核酸序列的提取 安装perl程序软件→打开并输入基因adhP→回车→生成结果在DNA-seq.fasta格式的文件中用TXT文本格式打开即是基因核酸序列。 4. adhP基因蛋白序列的提取 安装perl程序软件→打开并输入基因adhP→回车→生成结果在Protein-seq.fasta格式的文件中用TXT文本格式打开即是所要的蛋白质序列。 5. adhP基因蛋白序列的搜索 打开NCBI→点击BLAST→点击protein blast→输入蛋白序列→选择参数默认→点击左下角BLAST→从结果中选择符合条件的值。 6. adhP基因蛋白序列的多序列比对 使用工具clustalx 操作过程:在NCBI中点击DBQ→点击Batch→Entrez找到合适的十个氨基酸序列按Accession号→输入在桌面的TXT文本中→打开clustalx软件→点击“文件”找到下拉菜单的“载入序列”载入桌面TXT文本→点击“序列比对”找到下拉菜单中的“进行完全比对→点击Align按钮。 7. 根据蛋白序列构建的adhP基因种系发生树BQ 使用工具安装MEGA5软件 操作过程:MEGA5软件→File→Open A File(10个氨基酸序列的fasta 格式)→Align→全选序列(ctrl A)→Alignment→Clustal W(不该参数)→OK→保存(*.mas、*.meg)→File→Open A File→Analiza→phylogeny→NJ→点击“YES”→讲出现的框里选择“Text of phylogeny”boottrap text(500)→点击compute。 蛋白序列分析 输入/tools/网站根据所需要的选择不同的蛋白分析工具对之前获得的argH基因的氨基酸序列进行分析。 8.1将DNA翻译成蛋白质 Translate tool 输入/to

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档