2023年郑州大学《生物信息学》练习试卷1.pdfVIP

2023年郑州大学《生物信息学》练习试卷1.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2023年郑州大学《生物信息学》练习试卷1

一、名词解释

1、FASTA序列格式

答案:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,

大于号()表示一个新文件的开始,其他无特殊要求。

2、genbank序列格式

答案:是GenBank数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文

件格式按域划分为4个部分答案:第一部分包含整个记录的信息(描述符);第二部分包含

注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“/

/”结尾。

3、查询序(querysequence)

答案:也称被检索序列,用来在数据库中检索并进行相似性比较的序列。

4、空位(gap)

答案:在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果

这样在其中一序列上产生中断现象,这些中断的位点称为空位。P29

5、空位罚分

答案:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表

真正的进化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。P37

6、E值

答案:衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序

(query)相匹配的随机或无关序列的概率,E值越接近零,越不可能找到其他匹配序列,E

值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义

P95

7、低复杂度区域

答案:BLAST搜索的过滤选项。指序列中包含的重复度高的区域,如poly(A)。

8、点矩阵(dotmatrix)

答案:构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相

同碱基的对应位置(x,y)加点,如果两条序完全相同会形成一条主对角线,如果两条

序列相似会出现一条或者几条直线;如果完全没有相似性不能连成直线。

9、多序列比对

答案:通过序列的相似性检索得到许多相似性序列,将这些序做一个总体的比对,以观

察它们在结构上的异同,来回答大量的生物学问题。

10、分子钟

答案:认为分子进化速率是恒定的或者几乎恒定的假说,从而可以通过分子进化推断出物

种起源的时间。

11、系统发育分析

答案:通过一组相关的基因或者蛋白质的多序列比对或其他性状,可以研究推断不同物种

或基因之间的进化关系。

12、进化树的二歧分叉结构

答案:指在进化树上任何一个分支节点,一个父分支都只能被分成两个子分支。

13、系统发育图

答案:用枝长表示进化时间的系统树称为系统发育图,是引入时间概念的支序图。

14、直系同源

答案:指由于物种形成事件来自一个共同祖先的不同物种中的同源序列,具有相似或不同

的功能。(书答案:在缺乏任何基因复制证据的情况下,具有共同祖先和相同功能的同源基

因。)

15、旁系(并系)同源

答案:指同一个物种中具有共同祖先,通过基因重复产生的一组基因,这些基因在功能上

可能发生了改变。(书答案:由于基因重复事件产生的相似序列。)

文档评论(0)

。。。。 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档