生物信息学简明教程【参考】.doc

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学 简明教程 第一章 概论 3 第二章 生物信息数据库与查询 5 2.1 基因和基因组数据库 5 1. Genbank 5 2. EMBL核酸序列数据库 7 3. DDBJ数据库 7 4. GDB 7 2.2 蛋白质数据库 8 1. PIR和PSD 8 2. SWISS-PROT 8 3. PROSITE 9 4. PDB 9 5. SCOP 9 6. COG 9 2.3 功能数据库 10 1. KEGG 10 2. DIP 10 3. ASDB 10 4. TRRD 11 5. TRANSFAC 11 2.4 其它数据库资源 11 1. DBCat 11 2. PubMed 12 第三章 序列比对和数据库搜索 12 3.1 序列两两比对 12 3.2 多序列比对 17 第四章 核酸与蛋白质结构和功能的预测分析 17 4.1 针对核酸序列的预测方法 18 1. 重复序列分析 18 2. 数据库搜索 19 3. 编码区统计特性分析 19 4. 启动子分析 19 5. 内含子/外显子剪接位点 19 6. 翻译起始位点 20 7. 翻译终止信号 20 8. 其它综合基因预测工具 20 9. tRNA基因识别 20 4.2 针对蛋白质的预测方法 21 1. 从氨基酸组成辨识蛋白质 21 2. 预测蛋白质的物理性质 21 3. 蛋白质二级结构预测 22 4. 其它特殊局部结构 23 5. 蛋白质的三维结构 23 第五章 分子进化 24 5.1 分子进化钟与中性理论 24 5.2 进化树 26 5.3结构进化树 29 1.刚体结构叠合比较 30 2.多特征结构比较 30 3.相关软件 30 第六章 基因组序列信息分析 31 6.1 基因组序列分析工具 32 1. Wisconsin软件包(GCG) 32 2. ACEDB 35 3.其它工具 36 6.2人类和鼠类公共物理图谱数据库的使用 36 1.物理图谱的类型 36 2.大型公用数据库中的基因组图谱 37 3.鼠类图谱来源 46 6.3 全基因组比较 47 6.4 SNP的发现 47 第七章 功能基因组相关信息分析 48 7.1 大规模基因表达谱分析 48 1.实验室信息管理系统 49 2.基因表达公共数据库 50 3.大规模基因表达谱数据分析方法 52 7.2 基因组水平蛋白质功能综合预测 54 第一章 概论 当前人类基因组研究已进入一个重要时期,2000年将获得人类基因组的全部序列,这是基因组研究的转折点和关键时刻,意味着人类基因组的研究将全面进入信息提取和数据分析阶段,即生物信息学发挥重要作用的阶段。到1999年12月15日发布的第115版为止,GenBank中的DNA碱基数目已达46亿5千万,DNA序列数目达到535万;其中EST序列超过339万条; UniGene的数目已达到7万个;已有25个模式生物的完整基因组被测序完成,另外的70个模式生物基因组正在测序当中;到2000年1月28日为止,人类基因组已有16%的序列完成测定,另外37.7%的序列已经初步完成;同时功能基因组和蛋白质组的大量数据已开始涌现。如何分析这些数据,从中获得生物结构、功能的相关信息是基因组研究取得成果的决定性步骤。 生物信息学是在此背景下发展起来的综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科。生物信息学是内涵非常丰富的学科,其核心是基因组信息学,包括基因组信息的获取、处理、存储、分配和解释。基因组信息学的关键是“读懂”基因组的核苷酸顺序,即全部基因在染色体上的确切位置以及各DNA片段的功能;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行药物设计。了解基因表达的调控机理也是生物信息学的重要内容,根据生物分子在基因调控中的作用,描述人类疾病的诊断、治疗内在规律。它的研究目标是揭示"基因组信息结构的复杂性及遗传语言的根本规律",解释生命的遗传语言。生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。 近来的研究表明,基因组不仅是基因的简单排列,它有其特有的组织结构和信息结构,这种结构是在长期的演化过程中产生的,也是基因发挥其功能所必须的。弄清楚生物体基因组特有的组织结构和信息结构,解译生命的遗传语言的关键。 目前在数据库中已经有越来越多的模式生物全基因组序列,第一个人类染色体全序列--第22号染色体的测序工作已经在1999年12月完成,整个人类基因组计划工作草图将在最近完成。这无疑给基因组组织结构和信息结构的研究工作提供了大量的第一手材料,同时也为基因组研究取得突破性进

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档