生物信息学期末考试重点.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
 生 物 信 息 学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解 释等各方面的学科,也是随着 生 命 科 学和 计 算 机 科 学的迅猛发展,生命科学和计 算机科学相结合形成的一门新学科。它通过综合利用生物学,计算机科学和信息技 术而揭示大量而复杂的生物数据所赋有的生物学奥秘。 数据库(Database)是按照 数 据 结 构来组织、 存 储和管理数据的仓库,它产生于 距今六十多年前,随着 信 息 技 术和市场的发展,特别是二十世纪九十年代以后, 数 据 管 理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方 式。数据库有很多种 类 型,从最简单的存储有各种数据的 表 格到能够进行海量 数 据 存 储的大型 数 据 库 系 统都在各个方面得到了广泛的应用。 表达序列标签 从一个随机选择的 cDNA 克隆进行 5’端和 3’端单一次测序获得的短 的 cDNA 部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从 20 到 7000bp 不等,平均长度为 360 ±120bp。EST 来源于一定环境下一个组织总 mRNA 所构建的 cDNA 文库,因此 EST 也能说明该组织中各基因的表达水平。 开放阅读框 是 基 因序列中的一段无终止序列打断的 碱 基序列,可编码相应的 蛋 白。 ORF 识别包括检测六个阅读框架并决定哪一个包含以 启 动 子和 终 止 子为界限的 DNA 序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个 真正的单一的基因产物。ORF 的识别是证明一个新的 DNA 序列为特定的蛋白质编 码基因的部分或全部的先决条件。 蛋白质的一级结构 在每种蛋白质中 氨 基 酸按照一定的数目和组成进行排列,并进 一步折叠成特定的 空 间 结 构前者我们称为蛋白质的一级结构,也叫初级结构或基 本结构。蛋白质一级结构是理解 蛋 白 质 结 构、作用机制以及与其同源 蛋 白 质 生 理 功 能的必要基础。 基因识别 是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别 DNA 序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码基因, 也包括其他具有一定生物学功能的因子,如 RNA 基因和调控因子。基因识别是基 因组研究的基础。 单核苷酸多态 指在基因组水平上由单个核苷酸的变异所引起的 DNA 序列多态性。 这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基 的插入或缺失所致,它是人类可遗传的变异中最常见的一种。占所有已知多态性的 90%以上。 系统发育进化树 Phylogenetic trees 用一种类似树状分支的图形来概括各种(类) 生物之间的亲缘关系,进化树由结点(node)和进化分支(branch)组成,每一 结点表示一个分类学单元(属、种群、个体等),进化分支定义了分类单元(祖先 与后代)之间的关系,一个分支只能连接两个相邻的结点。进化树分支的图像称为 进化的拓扑结构,其中分支长度表示该分枝进化过程中变化的程度,标有分枝长度 的进化分支叫标度枝(scaled branch)。 序列拼接 为了保证测序结果的准确性,单基因短片段(700pd 左右)测序一般应 采用双向测序,然后将双向测序的结果拼接在一起,从而获得一致性序列。线粒体 基因组测序和 DNA 长片段测序一般是通过分段测序来完成的,最后也需要将测出 的短片段拼接成一条完整的序列。 分子钟  直系同源(orthology) )在进化上起源于一个始祖基因并垂直传递的同源基因;分布 于两种或两种以上物种的基因组;功能高度保守乃至于近乎相同,甚至于其在近缘 物种可以相互替换;结构相似;组织特异性与亚细胞分布相似。 基因芯片(gene chip) 通过微加工技术 ,将数以万计、乃至百万计的特定序列的 DNA 片段(基因探针),有规律地排列固定于 2cm2 的硅片、玻片 等支持物上, 构成的一个二维 DNA 探针阵列,与计算机的电子芯片十分相似,所以被称为基因 芯片。基因芯片主要用于基因检测工作 。 转录组 Transcriptome 广义上指某一生理条件下,细胞内所有转录产物的集合,包括 信使 RNA、核糖体 RNA、转运 RNA 及非编码 RNA;狭义上指所有 mRNA 的集 合。 人类基因组计划 是一项规模宏大,跨国跨学科的科学探索工程。其宗旨在于测定 组成人类 染 色 体(指 单 倍 体)中所包含的 30 亿个 碱 基对组成的 核 苷 酸序列,

文档评论(0)

fangqing12 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档