生物信息学复习题及答案(陶士珩)剖析.docxVIP

  • 4
  • 0
  • 约1.79万字
  • 约 22页
  • 2020-03-30 发布于江西
  • 举报

生物信息学复习题及答案(陶士珩)剖析.docx

生物信息学复习题 名词解释 Homology (同源):来源于共同祖先的序列相似的序列及同源序列。序列相似序列并不一 定是同源序列。 Orthologs(直系同源):指由于物种形成的特殊事件来自一个共同祖先的不同物种中的 同源序列,它们具有相似的功能。 Paralogs(旁系(并系)同源):指同一个物种中具有共同祖先,通过基因复制产生的 一组基因,这些基因在功能上的可能发生了改变。基因复制事件是促进新基因进化的重要 推动力。 Xenologs (异同源):通过横向转移,来源于共生或病毒侵染而产生的相似的序列,为异 同源。 Identity Score:The sum of the number of identical matches and conservative (high scoring) substitutions in a sequence alignment divided by the total number of aligned sequence characters. Gap 总是不计入总数中。 点矩阵(dot matrix):构建一个二维矩阵,其 X 轴是一条序列,Y 轴是另一个序列, 然后在 2 个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条 主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连 成直线。 E 值:得分大于等于某个分值 S 的不同的比对的数目在随机的数据库搜索中发生的可能 性。衡量序列之间相似性是否显著的期望值。E 值大小说明了可以找到与查询序列 (query)相匹配的随机或无关序列的概率,E 值越小意味着序列的相似性偶然发生的机会 越小,也即相似性越能反映真实的生物学意义,E 值越接近零,越不可能找到其他匹配序 列。 P 值:得分为所要求的分值比对或更好的比对随机发生的概率。它是将观测得到的比对 得分 S,与同样长度和组成的随机序列作为查询序列进行数据库搜索进行比较得到的 HSP(高分片段对)得分的期望分布联系起来计算的。通常使用低于 0.05 来定义统计的显 著性。P=1-e -E 9. 打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括 基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如 PAM)两类方法,是序 列相似性分析的基础,其不同的选择将会出现不同的分析结果。 10.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最 佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。 NCBI:美国国家生物技术信息学中心,属于美国国立医学图书馆的一部分,具有 BLAST, Entrez ,GenBank 等工具,还具有 PubMed 文献数据库。另外还具有 Genome, dbEST, dbGSS , dbSTS, MMDB, OMIM, UniGene, Taxonomy, RefSeq, etc. FASTA 序列格式:是将 DNA 或者蛋白质序列表示为一个带有大于号()开始的核苷酸 或者氨基酸序列的新文件,其中大于号后可以跟上序列的相关信息,其他无特殊要求。 13genbank 序列格式:是 GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列 格式之一。该文件格式按域划分为 4 个部分:第一部分包含整个记录的信息(描述符); 第二部分包含注释,主要包含生物功能或数据库信息;第三部分是 feature,对序列的注 释;第四部分是序列本身,以“//”结尾。 1 Entrez 检索系统:是 NCBI 开发的核心检索系统,集成了 NCBI 的各种数据库,具有链 接的数据库多,使用方便,能够进行交叉索引等特点,可以使用关键词如基因名字、物种 名字及生物学功能检索等。 BLOSUM 矩阵:模块替代矩阵。矩阵中的每个位点的分值来自蛋白比对的局部块中的替 代频率的观察。每个矩阵适合特定的进化距离。例如,在 BLOSUM62 矩阵中,比对的分值来 自不超过 62%一致率的一组序 系统发生树(Phylogenetic tree )是研究生物进化和系统发育过程中的一种用树状分 支图来概括各种生物之间亲缘关系,是一种亲缘分支 分 类 方 法。在树中,每个节点代表其 各分支的最近共同祖先,而节点间的线段长度对应演化距离(如估计的 演 化 时 间)。是用来 研究物种进化与多样性的基础,是相近物种相关生物学数据的来源。 基因树与物种树:物种树反映一组物种进化历程的系统树,其中每一个内部节点就代表 一个物种形成的过程,而基因树则是代表来源于不同物种的单个同源基因的差异构建的系 统树,而其内部的一个节点则代表一个祖先基因分化为两个新的独

文档评论(0)

1亿VIP精品文档

相关文档