- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
⽣物信息学_复习题及答案(打印)
⼀、名词解释:
1.⽣物信息学:研究⼤量⽣物数据复杂关系的学科,其特征是多学科交叉,以互联⽹为媒介,数据库为载体。利⽤数学知识建
⽴各种数学模型;利⽤计算机为⼯具对实验所得⼤量⽣物学数据进⾏储存、检索、处理及分析,并以⽣物学知识对结果进⾏解
释。
2.⼆级数据库:在⼀级数据库、实验数据和理论分析的基础上针对特定⽬标衍⽣⽽来,是对⽣物学知识和信息的进⼀步的整
理。
3.FASTA序列格式:是将DNA 或者蛋⽩质序列表⽰为⼀个带有⼀些标记的核苷酸或者氨基酸字符串,⼤于号()表⽰⼀个新
⽂件的开始,其他⽆特殊要求。
4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为⼴泛的⽣物信息学序列格式之⼀。该⽂件格式按域划分为4
个部分:第⼀部分包含整个记录的信息(描述符);第⼆部分包含注释;第三部分是引⽂区,提供了这个记录的科学依据;第
四部分是核苷酸序列本⾝,以“//”结尾。
5.Entrez检索系统:是NCBI开发的核⼼检索系统,集成了NCBI的各种数据库,具有链接的数据库多,使⽤⽅便,能够进⾏交
叉索引等特点。
6.BLAST :基本局部⽐对搜索⼯具,⽤于相似性搜索的⼯具,对需要进⾏检索的序列与数据库中的每个序列做相似性⽐较。
P94
7.查询序列(query sequence):也称被检索序列,⽤来在数据库中检索并进⾏相似性⽐较的序列。P98
8.打分矩阵 (scoring matrix):在相似性检索中对序列两两⽐对的质量评估⽅法。包括基于理论(如考虑核酸和氨基酸之间的
类似性)和实际进化距离 (如PAM )两类⽅法。P29
9.空位 (gap):在序列⽐对时,由于序列长度不同,需要插⼊⼀个或⼏个位点以取得最佳⽐对结果,这样在其中⼀序列上产
⽣中断现象,这些中断的位点称为空位。P29
10.空位罚分:空位罚分是为了补偿插⼊和缺失对序列相似性的影响,序列中的空位的引⼊不代表真正的进化事件,所以要对
其进⾏罚分,空位罚分的多少直接影响对⽐的结果。P37
11.E值:衡量序列之间相似性是否显著的期望值。E值⼤⼩说明了可以找到与查询序列(query)相匹配的随机或⽆关序列的
概率,E值越接近零,越不可能找到其他匹配序列,E值越⼩意味着序列的相似性偶然发⽣的机会越⼩,也即相似性越能反映
真实的⽣物学意义。P95
12.低复杂度区域:BLAST 搜索的过滤选项。指序列中包含的重复度⾼的区域,如poly (A)。
13.点矩阵 (dot matrix):构建⼀个⼆维矩阵,其X轴是⼀条序列,Y轴是另⼀个序列,然后在2个序列相同碱基的对应位置
(x,y)加点,如果两条序列完全相同则会形成⼀条主对⾓线,如果两条序列相似则会出现⼀条或者⼏条直线;如果完全没有
相似性则不能连成直线。
14.多序列⽐对:通过序列的相似性检索得到许多相似性序列,将这些序列做⼀个总体的⽐对,以观察它们在结构上的异同,
来回答⼤量的⽣物学问题。
15.分⼦钟:认为分⼦进化速率是恒定的或者⼏乎恒定的假说,从⽽可以通过分⼦进化推断出物种起源的时间。
16.系统发育分析:通过⼀组相关的基因或者蛋⽩质的多序列⽐对或其他性状,可以研究推断不同物种或基因之间的进化关
系。
17.进化树的⼆歧分叉结构:指在进化树上任何⼀个分⽀节点,⼀个⽗分⽀都只能被分成两个⼦分⽀。
系统发育图:⽤枝长表⽰进化时间的系统树称为系统发育图,是引⼊时间概念的⽀序图。
18.直系同源:指由于物种形成事件来⾃⼀个共同祖先的不同物种中的同源序列,具有相似或不同的功能。(书:在缺乏任何
基因复制证据的情况下,具有共同祖先和相同功能的同源基因。)
19.旁系(并系)同源:指同⼀个物种中具有共同祖先,通过基因重复产⽣的⼀组基因,这些基因在功能上可能发⽣了改变。
(书:由于基因重复事件产⽣的相似序列。)
20.外类群:是进化树中处于⼀组被分析物种之外的,具有相近亲缘关系的物种。
21.有根树:能够确定所有分析物种的共同祖先的进化树。
22.除权配对算法(UPGMA):最初,每个序列归为⼀类,然后找到距离最近的两类将其归为⼀类,定义为⼀个节点,重复
这个过程,直到所有的聚类被加⼊,最终产⽣树根。
23.邻接法(neighbor-joining method):是⼀种不仅仅计算两两⽐对距离,还对整个树的长度进⾏最⼩化,从⽽对树
的拓扑结构进⾏限制,能够克服UPGMA算法要求进化速率保持恒定的缺陷。
24.最⼤简约法(MP):在⼀系列能够解释序列差异的的进化树中找到具有最少核酸或氨基酸替换的进化树。
25.最⼤似然法(ML):它对每个可能的进化位点分配⼀个概率,然后综合所有位点,
原创力文档


文档评论(0)