生物信息学资料.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

生物信息学的定义

广义上,生物信息学(Bioinformatics)包含了对生物信息的获取、加工、储存、分析和解释等,并综合运用数学、计算机科学和生物学的各种工具,来阐明大量生物学数据所包含的生物学意义。

生物信息学研究的具体内容

把基因组DNA序列信息分析作为源头,找到基因组中代表蛋白质和RNA基因的编码区,阐明非编码区的信息实质,破译隐藏在DNA序列中的语文规律;同时,归纳、整理与基因组遗传语文信息释放及其调控相关的转录谱和蛋白质谱数据,从而认识代谢、发育、分化、进化的规律。

生物信息学具有三个方面的科学基础

发达的、复杂的、可以相互交流的数据库系统

强有力的创新算法和软件

自动化、大规模、高通量的生物学研究方法与平台技术

分子生物信息数据库的种类

基因组数据库

核酸和蛋白质一级结构(序列)数据库

生物大分子(主要是蛋白质)空间结构数据库

二次数据库

二次数据库

对一次数据库以及文献等数据进行分析、整理、归纳、注释

二次数据库的种类

以核酸数据库为基础:

真核生物启动子数据库EPD

克隆载体数据库Vector

基因转录调控因子数据库TransFac

以蛋白质序列数据库为基础:

蛋白质功能位点数据库Prosite

蛋白质序列指纹图谱数据库Prints

同源蛋白家族数据库Pfam

同源蛋白结构域数据库Blocks

二次数据库的种类

以具有特殊功能的蛋白质为基础:

免疫球蛋白数据库Kabat

蛋白激酶数据库PKinase

以三维结构原子坐标为基础:

蛋白质二级结构构象参数数据库DSSP

已知空间结构的蛋白质家族数据库FSSP

已知空间结构的蛋白质及其同源蛋白数据库HSSP

两类数据库的特点:

一次数据库

数据量大,更新速度快,用户面广

需要高性能的计算机服务器、大容量的磁盘空间和专门的数据库管理系统支撑。

例如,欧洲生物信息学研究所用Oracle数据库软件管理、维护核酸数据库EMBL;基因组数据库GDB的管理运行基于Sybase数据库管理系统。

两类数据库的特点:

二次数据库

容量小,更新速度较慢,可以不用大型商业数据库软件支持。

许多二次库的开发基于Web浏览器。其优点是使用方便,使用者不需要有丰富的计算机专业知识。

序列数据库是分子生物信息数据库的重要组成部分,包括核酸和蛋白质两类,以核苷酸碱基顺序和氨基酸残基顺序为基本内容,并附有注释信息。

三大核酸数据库

GenBank,由美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation,NCBI)维护。

三大核酸数据库

EMBL数据库是由欧洲分子生物学实验室(EuropeanMolecularBiologyLaboratory,EMBL)创建,并因此得名,现由欧洲生物信息学研究所(EuropeanBioinformaticsInstitute,EBI)维护。

三大核酸数据库

DDBJ(DNADateBaseofJapan)由日本国家遗传学研究所(NationalInstituteofGenetics,NIG)维护。

GDB人类基因组数据库

1)基因组结构数据:

基因单位、PCR位点、细胞遗传标记、EST、

叠连群、重复片段等。

2)基因组图谱:

细胞遗传图、连锁图、放射杂交图、转录图等。

3)基因多态性数据:等位基因等。

4)与其他数据库的超文本链接:

GenBank、EMBL、遗传疾病数据库OMIM、

MedLine等。

同源序列是指从某一共同祖先经趋异进化而形成的不同序列。

相似性是指序列比对过程中,检测序列和目标序列之间相同碱基或氨基酸残基序列所占比例的高低。

整体比对(Globalalignment):从序列全长出发,考虑序列的整体相似性。

局部比对(Localalignment):考虑序列部分区域的相似性。

在核酸序列数据库中运行BLAST步骤

1、提交检测序列

2、选择数据库

3、选择物种

4、选择程序和算法

5、查看比对结果

1、分子生物信息数据库的种类,以及各类数据库的数据来源和特点,每类能列举2-3个具有代表性的数据库。

2、什么是数据库查询?举例说明常用的数据库查询系统有什么特点?

3、什么是数据库搜索?其工作基础、任务和目的分别是什么?

4、BLAST的中英文含义分别是什

文档评论(0)

胜家 + 关注
实名认证
内容提供者

文档好 才是真的好

1亿VIP精品文档

相关文档