生物信息学近年原文.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

生物信息学是一门交叉学科。它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。

生物信息学意义

利用数理统计、模式识别、动态规划、密码解读、语意解析、信令传递、神经网络、遗传算法以及隐马氏模型等各种方法

1对序列、结构数据进行定性和定量分析,从中获取基因编码、基因调控、序列-结构-功能关系等理性知识

2阐明细胞、器官和个体的发生、发育、病变、衰亡的基本规律和时空联系

3探索生命起源、生物进化、生命本质等重大理论问题,最终建立“生物学周期表”

4指导分子生物学实验

生物信息学研究内容

与HGP相关的生物信息学研究:1、高度自动化的实验数据的获得、加工和整理2、序列片段的拼接3、基因识别4基因功能预测(二)蛋白质结构预测(三)比较基因组学研究1、基于完整基因组数据的生物进化研究2、基因表达分析和调控网络研究

利用生物信息学的一般步骤:

1.确立研究的生物学体系。例如:基因功能分析;蛋白质三级结构与功能;信号传导等等.

2.确定研究的具体问题。

3.相关文献和数据的搜索,设计实验.

4.利用相关数据库可软件分析实验结果。

5.构建生物学/数学模型,利用实验数据解释所研究的生物学问题.

6.扩展及应用:有哪些用处?

数据库定义

数据库是在数据库管理系统的集中控制之下,按一定的组织方式存储起来的、相互关联的数据集合。在数据库中集中了一个部门或单位完整的数据资源,这些数据能够为多个用户同时共享,且具有冗余度小、独立性和安全性高等特点。

生物信息数据库分类

一般而言,生物信息数据库可以分为一级数据库和二级数据库。

一级数据库的数据都直接来源于实验获得的原始数据,只经过简单的归类整理和注释;

二级数据库是在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步整理。

生物信息数据库按功能分类基因组数据库:来自基因组作图;核酸和蛋白质一级结构序列数据库:来自序列测定;生物大分子(主要是蛋白质)三维空间结构数据库:来自X-衍射和核磁共振结构测定;以上述3类数据库和文献资料为基础构建的二次(级)数据库。

核酸序列数据库内容包括世界上所有已公布的核酸序列及其翻译产物序列报告和相关注释:GenBank美国基因数据银行;Embl欧洲分子生物实验室

蛋白质序列数据库SWISS-PROT(瑞士日内瓦大学)蛋白质序列数据库内容包括序列及功能信息、蛋白识别、蛋白质结构预测及其他功能

NCBI蛋白质数据库包括所有蛋白质序列,及其翻译产物序列

蛋白质结构数据库

PDBProteinDataBank,美国Brookhaven国家实验室管理生物大分子三维空间结构原子坐标

NCBISTRUCTUREMMDB(MolecularModellingDataBase),包含了从PDB获取的实验确定的生物高聚物结构分子模型数据库

基因组数据库图谱和显示器

主要内容:有基因组结构、基因单位、基因组图谱等(遗传图、叠连群图、放射杂交图等)

分布:由各国基因组研究中心组建,分布在世界各地的信息中心、研究机构。代表性的有:

美国人类基因组数据库GDB

美国NCBI基因组数据库;英国人类基因图谱数据库美国人类基因组资源整合体系

人类疾病与基因数据库OMIM孟德尔遗传信息数据库

CGAP:TheCancerGenomeAnatomyProject肿瘤基因组图谱知识库美国国立癌症研究所为解剖肿瘤细胞分子而建立。

生物信息分析工具BLAST序列相似性对比;PRIMER引物设计

蛋白质结构预测数据库(EMBL)根据已知蛋白质序列,预测同族二级、三维等结构

蛋白质功能预测数据库(EMBL)根据已知蛋白质序列,预测蛋白质功能

生物信息数据库检索

集成检索系统:Entrez系统(整合库)美国生物技术信息中心研制

SRS系统(SequenceRetrievalSystem)欧洲分子生物学实验室开发

大规模基因测序关键技术Sanger双脱氧末端终止法;PCR技术;DNA自动测序仪的发展;生物信息学分析软硬件设施

大规模测序基本策略

逐个克隆法:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)

全基因组鸟枪法:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)

聚合酶链式反应(polymerasechainreaction,PCR),是一种在体外快速扩增特定基因或DNA序列的方法,故又称为基因的体外扩增法。以拟扩增的DNA分子为模板,以

您可能关注的文档

文档评论(0)

辉辉 + 关注
实名认证
内容提供者

好文件 大家都可以分享

1亿VIP精品文档

相关文档