第四讲-2 基因组测序计划和结构基因组学.ppt

第四讲-2 基因组测序计划和结构基因组学.ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多学科交叉、互相推动发展 生物学、物理学、化学、数学、计算机科学、信息科学、系统科学····· 以基因组DNA序列信息为源头,识别基因组序列中代表蛋白质 和RNA基因的编码区,阐明非编码区的信息特征,破译隐藏在 DNA序列中的遗传语言规律; 同时,归纳、整理与基因组遗传语言信息释放及其调控相关的 转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化 的规律。 生物信息学/计算生物学 揭示基因组蛋白质组信息结构的复杂性、遗传语言的根本规律 生物学信息的计算机处理 计算生物学 / 理论生物学 前基因组时代的“钓鱼”和后基因组时代的“捞鱼” When I give talks to young scientists seeking advice about areas of future intense scientific excitement, computational biology is my number one recommendation. Francis Collins, Director of HGP at NIH The next step in the project is the “interpretation phase”. That is really the fun part of the whole project because then we finally have the complete order of all layers of genetic codes and we have to discover what it all means. J. Craig Venter, Head of Celera Genomics Inc. 生物学家 (生物学问题) 数学物理学家 计算机科学家 (基础理论问题) 工程师 (技术应用) 计算生物学/生物信息学: 三种科学文化的融合 §1.3 生物信息学主要研究内容和方法 生物学数据的收集、存储、管理与提供 基因组序列信息的提取和分析 功能基因组相关信息分析 生物大分子结构模拟和药物设计 生物信息分析的技术与方法研究 应用与发展研究 生物信息学的主要研究内容 基于数据挖掘(知识发现)的方法 (Data-mining, Knowledge Discovery) Extracts the hidden patterns from huge quantities of experimental data, and forms hypotheses as a result. 基于模拟分析的方法 (Simulation-based Analysis) Tests hypotheses with in silico experiments, providing predictions to be tested by in vitro and in vivo studies. 计算生物学/生物信息学的主要理论方法 DNA序列 RNA序列 蛋白质 由重复的核苷酸或氨基酸单元组成的线性高分子,具有高度有序并能完成特定生物学功能的三维结构 目的 揭示序列蕴含的更高级的结构和功能信息 主要思想 具有相似序列的分子,可能具有相似的三维结构和生物学功能。 首要任务:提取反映结构、功能性质的序列特征 主要方法 基于数据挖掘或知识发现(data-mining, knowledge discovery)的方法: 统计方法、机器学习、神经网络等 §1.3.1 核酸和蛋白质序列分析研究 搜集数据 (采样、实验设计) 从事物的外在数量上的表现去推断事物可能的规律性 分析数据 (建模、知识发现) 推理 (预测、分类) 回归分析 聚类分析 探索性分析 判别分析 多元回归、自回归… 线性判别分析、非线性判别分析… 系统聚类分析、动态聚类分析… 主元分析、相关性分析… 统计方法 学习:系统通过执行某种过程而改进它的性能 规则归纳 范例推理 遗传算法 决策树 AQ算法… 直接使用过去的经验或解法来求解给定的问题… 环境 学习单元 知识库 执行单元 反馈 机器学习方法 模仿人脑神经网络的结构和某些工作机制,利用大量的神经元连成网络来实现大规模并行计算。通过学习,改变神经元之间的连接强度。 McCulloch-Pitts模型 反传网络模型 多层感知器模型 …… 人工神经网络方法 生命科学中的问题 数理问题/算法 相似性搜寻 两两序列比对 相似序列的数据库搜寻 多序列比对 系统发育树重建 蛋白质三维结构比对 寻优算法 ——动态规划算法 ——模拟退火算法 ——遗传算法 ——人工神经网络方法 序列分析中的主要

文档评论(0)

a13355589 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档