- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * 生物信息学的常用算法与方法 动态规划算法(Dynamic programming); 贝叶斯统计(bayesian statistic); 人工神经网络(ANNs); 马尔可夫模型和隐马尔科夫模型(HMM); 遗传算法(Genetic Algorithm); 蒙特卡洛方法(Monte Carlo); 模拟退火算法(Simulated Annealing); 支持向量机(SVM); … 科研机构及网络资源中心 NCBI:美国国立卫生研究院NIH下属国立生物技术信息中心NCBI。 EMBnet:欧洲分子生物学网络/ EMBL-EBI:欧洲分子生物学实验室下属欧洲生物信息学研究所。 http://www.ebi.ac.uk/ ExPASy: (Expert Protein Analysis System)瑞士生物信息研究所SIB下属的蛋白质分析专家系统; / 科研机构及网络资源中心 Bioinformatics Links Directory:http://bioinformatics.ca/links_directory/ 各种数据库等 如 PDB (Protein Data Bank) UniProt 数据库 软件资源: /tools/ http://www.ebi.ac.uk/Tools/ /Tools/ 国内生物信息中心举例 CBIPKU:北京大学生物信息中心 /chinese/ BioSino:中国生物信息 / 中国科学院上海生命科学院生物信息中心 上海生物信息技术研究中心 / 生物信息学的相关杂志 研究生物信息学的一般步骤 1. 确立研究的生物学体系。例如:生物芯片数据分析;蛋白质三级结构与功能; 2. 确定研究的问题。已有哪些计算方面的工作?是否需要实验的支持? 3. 构建生物学/数学模型,例如:ligand结合位点的预测,构建特异性识别位点的结构模式模型。 4. 计算方法的选择或开发:HMM, SVM, ANN或新方法。 5. 计算结果分析,与同类工具做比较。构建相应的数据库/软件/在线网站等。 6. 扩展及应用:有哪些用处? 计算生物学 vs. 生物信息学 计算生物学(Computational Biology):根据美国国家卫生研究所(NIH)的定义,它是指开发和应用数据分析及理论的方法、数学建模和计算机仿真技术,用于生物学、行为学和社会群体系统的研究的一门学科。 生物信息学主要侧重于对生物学信息的存贮、分析处理、有效信息和知识的提取方面。 计算生物学侧重于使用计算技术研究生物学问题。 “生物信息学和计算生物学”计划 NIH于2003年形成了一个通向生命科学未来的“中长期发展规划”--国立卫生研究院路线图(NIH??Roadmap)。NIH路线图中启动了一个“生物信息学和计算生物学”计划,希望通过这个项目的实施而铺设一条通向生命科学未来的“信息高速公路”。该项目计划从2004年开始,建立数个“国立生物医学计算中心” ,以便开发相关软件和数据管理工具。 参考教材 生物信息学:序列与基因组分析,(第二版),David W.Mount,科学出版社 生物信息学,DRWesthead,JHParish,RMTwyman,科学出版社 生物信息学,许忠能 主编 赵伟 zhaowei@ 熊鹏 xiongxp@ 注:本课程部分幻灯片整理自公共资源或Prof. Yu Xue Jian Ren PPT,特致谢! * * * * * * * * * * Sanger与合作者发现(Sanger, 1952),胰岛素蛋白质包含了固定组成的氨基酸。之前的观点认为蛋白质可能是由相似氨基酸堆积在一起的混合物,而不具有特定的结构。而Sanger发现胰岛素蛋白质作为一种纯净物(单一的分子),并且具有特定的三级结构。因此,Sanger推断蛋白质是排列完美的分子,而这种排列的完美性,其中应当蕴含着一些未知的机理。 Sanger与合作者分别对牛、猪和羊的胰岛素蛋白质进行了测序(Brown et al., 1955; Ryle et al., 1955),并做了序列上的比较。 1962年鲍林提出分子进化的理论(Pauling, 1964),这为接下来的生物信息学的发展,尤其是基于序列比对来发现同源/相似蛋白质的计算工作奠定了初步的理论基础。鲍林推测在人中,可能会存在大约50,000~100,000个不同的蛋白质,而由于当时已经知道基因编码蛋白质,且当时的理论认为一个基因编码一个蛋白质,鲍林推测人中可能会有大约50,000~100,000个不同的
文档评论(0)