14 生物信息学.ppt

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
14 生物信息学

;一、生物学基础;生物信息——广义的概念;发展背景;Background 背景;生物医药工业;Definition of Bioinformatics;Computation;算法 统计学 信息理论 图形学 科学可视化 图像识别 人工智能 密码学 非线性动力学 计算机模拟 语言学 机器学习 数据库 软件工程 计算机网络 分布式系统;生物信息学研究意义;生物信息学 – 研究方向;三、生物信息学的研究内容;Statistics 统计学;几个常用 数学模型概念与方法;网络技术;生物信息学研究内容;与HGP相关的生物信息学研究 ; 2、序列片段的拼接;Alignment;Raw DNA sequence;基因识别;基因预测的步骤: 1、识别可能的外显子 2、辨别起始/内部/终止外显子 3、把起始、一些内部的和终止外显子的连起来,形成可能的基因 4、确保该可能的基因没有内部的移位或终止密码子;Evaluating Gene Prediction;生物学家们为人类基因的数目打赌 生物学家们一直假设,微生物的故事较短,而人类的故事则是一部巨作,人类拥有8万到10万个基因。 德国分子生物技术研究所的 Andre Rosenthal 说,我们得出的结论是整个基因组有不多于4万个基因。 法国的分子遗传学家Hugues Roest Crollius通过比较现有的人类基因序列与淡水河豚基因序列,提出了更低的人类基因数估计:在27700与34300之间。 美国西雅图华盛顿大学的基因学家Phil Green是常用的组合基因序列数据的程序PHRED和PHRAP的发明人,他提出人类基因数大约为35000。国国家人类基因组研究所主任Francis Collins表示他同意Green的估计,在48011个基因上。 马里兰Rockville的基因组研究所(TIGR)的John Quackenbush根据TIGR的人类基因指数的估计,在118259个基因上。 加州Incyte Genomics公司的Sam LaBrie估计的基因数是153478个,该公司在1999年9月曾宣布人类基因至少有14万个。 ;基因功能预测 ;蛋白质序列库: PIR(protein information resource), Swiss-Prot 蛋白质高级结构数据库PDB(protein data bank): 生物大分子三级结构的数据库,包括原子标记、文献引用、一级和二级结构信息,以及晶体结构和核磁共振的数据。 同源比较算法: 分为整体对齐???Global alignment)和局部对齐(local alignment)局部对齐的算法有Smith-Watermann 算法;FASTA算法; BLAST算法;Protein Sequence;蛋白质结构预测 ;Anfinsen, 1960es X-射线衍射和核磁共振;蛋白质的二级结构;蛋白质分子的三级结构;其它结构层次;影响蛋白质结构的理化因素;同源模型方法;流行的序列分析工具;二级结构预测 ;蛋白质三级结构预测 ;一级序列;Macromolecular structure;Genomes; 比较基因组学研究;基于完整基因组数据的生物进化研究; 3、构建系统进化树。 根据序列同源性分析的结果,重建反映物种间进化关系的进化树。为完成这一工作已发展了多种软件包,象PYLIP、MEGA等; 4、稳定性检验。 为了检验构建好的进化树的可靠性,需要进行统计可靠性检验,通常构建过程要随机地进行成百上千次,只有以大概率(70%以上)出现的分支点才是可靠的。通用的方法使用 Bootstrap算法,相应的软件已包括在构建系统进化树所用的软件包当中。为便于使用者查找表三给出了进化分析相关软件的因特网地址。;Phylogeny of 23 completely sequenced Bacteria and Archaea species on the basis of 16s rRNA.;Gene expression;基因表达分析和调控网络研究;Hierarchical Clustering;Metabolic pathways;基因芯片设计及信息处理;四、生物信息学研究现状;国际著名的生物信息中心;国内部分生物信息学和生物医学信息服务器;北京大学生物信息中心

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档