12年复习大纲12复习大纲.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
12年复习大纲12复习大纲

《生物信息学》复习大纲 第一章:生物信息学概述 生物信息学概念 生物信息学是一门交叉科学,它包含了生物信息的获取、加工、存储、分配、分析、解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。 2、生物信息学分析的数据对象主要有哪几种? 生物分子信息具体表现为DNA序列数据、蛋白质序列数据、生物分子结构数据、生物分子功能数据等。序列数据、结构数据是非常直观的,但是功能数据却是多变复杂的,如关于蛋白质功能的定性描述、蛋白质之间的相互作用描述、基因表达数据、代谢路径、调控网络等。在所有类型的数据中,序列是最基本的数据,而且也是目前最多的数据。 3、生物信息学的主要研究应用是什么?(了解) 一、生物信息学数据库:生物数据库的建设是进行生物信息学研究的基础,目的是收集和管理生物分子数据,并进行数据分析和挖掘。 二、序列分析:包括序列比对和基因序列注释。 三、其他主要应用: (一)、比较基因组学;(二)、基因和蛋白质的表达分析;(三)、生物芯片大规模功能表达谱的分析;(四)、蛋白质结构的预测;(五)、蛋白质与蛋白质相互作用;(六)、生物系统模拟;(七)、代谢网络建模分析;(八)、计算进化生物学;(九)、生物多样性研究;(十)、合成生物学 第二章、生物分子数据库 1、一级数据库(Primary Database) 数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释 二级数据库(Secondary Database) 对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的 。 2、一些常用的数据库: 核酸序列数据库:;美国生物技术信息中心(NCBI的)GenBank数据库、欧洲分子生物学实验室的EMBL数据库、日本遗传研究所(NIG)的DDBJ数据库 基因组数据库:人类基因组数据库Ensembl 蛋白质序列数据库:SWISS-PROT、TrEMBL、PIR、Uniprot 蛋白质结构数据库:PDB数据库 文献数据库:NCBI的pubmed 3、Swiss-Prot, which is manually annotated and reviewed. TrEMBL, which is automatically annotated and is not reviewed. 4、数据库中的FASTA序列格式 FASTA 序列格式包括三个部分: (1)在注释行的第一列用字符“”标识,后面是序列的名字和来源 (2)标准的单字符标记的序列 (3)可选的“*”表示序列的结束,它可能出现也可能不出现 5、GenBank序列格式GenBank Flatfile (GBFF)标识字(要求看懂某个序列的GBFF格式) GenBank标识字 含义 LOCUS 序列名称 DEFINITION 序列简单说明 ACCESSION 唯一的序列编号 VERSION 序列版本号 KEYWORDS 与序列相关的关键词 SOURCE 序列来源的物种名 ORGANISM 序列来源的物种学名和分类学位置 REFERENCE 相关文献编号或提交注册信息 AUTHORS 相关文献作者或提交序列作者 TITLE 相关文献题目 JOURNAL 相关文献刊物名或作者单位 MEDLINE 相关文献Medline引文代码 REMARK 相关文献注释 COMMENT 关于序列的注释信息 FEATURES 序列特征表起始 BASE CONTENT 序列长度、碱基数目统计数 ORIGIN 序列 // 序列结束标志、空行 6、数据库查询(databaase query)和数据库搜索(database search) 数据库查询,是指对序列、结构以及各种二次数据库中的注释信息进行关键词匹配查找。常用的有NCBI的Entrez和EMBL的SRS 数据库搜索是专门针对核酸和蛋白质序列数据库而言,其搜索的对象,不是数据库的注释信息,而是序列信息。常用的有NCBI的BLAST 7、Entrez是一个用以整合NCBI数据库中信息的检索工具。这些数据库包括核酸序列,蛋白序列,大分子结构,全基因组,和通过PubMed检索的MEDLINE等。Entrez的成功之处在于数据库的耦合连接,数据库的记录与本数据库或者其它数据库中的记录相互连接,交叉索引。数据库内部的连接称为“邻接”。 8、布尔查询式:(要求懂得查询式的含义) Format: -- term [field] operator term [field] … Where Operator is any of : -- AND

文档评论(0)

yyanrlund + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档