- 85
- 0
- 约4.93千字
- 约 6页
- 2017-08-11 发布于重庆
- 举报
南方医科大学基础医学生物信息学重点
Made by Kim 2008级基础医学
1 在进行序列局部比对的时候,能不能在同一位置插入双gap?为什么?
不能,因为如果能在同一位置插入双gap的话,就能在两条序列的任何位置插入双gap,得出的对比结果都是一样的,没有统计学意义。
2 解释生物信息名词BLAST、CDS(GBFF格式中的特性关键词)、NCBI、UPGMA、EBI。
BLAST:Basic Local Alignment Search Tool基本局部相似性对比搜索工具;
CDS:Coding sequence蛋白编码区信息;
NCBI:National Center of Biotechnology Information 美国国立生物技术信息中心;
UPGMA:unweighted pair group method with arithmetic mean 非加权算术平均组对法;
EBI:European Bioinformatics Institute欧洲生物信息学中心。
3 NCBI的BLAST工具有5个基本程序,分别为nucleotide blast,protein blast,blastx,tblastn,tblastx,请分别说明每个程序解决的问题。
Blastn:用核酸序列搜索核算数据库;
Blastp:用蛋白质序列搜索蛋白质数据库;
Blastx:用核酸序列搜索蛋白质数据可库(先将核酸序列按6个可读框翻译成蛋白质序列);
Tblastn:用蛋白质序列搜索核算数据库(先将核酸数据库的序列按6个可读框翻译成蛋白质序列);
Tblastx:将查询序列和数据库里的核酸序列都按6个可读框翻译成蛋白质序列再对比,每两条序列进行36次对比。
4 如果我们想知道一个基因组DNA数据库中是否有某个蛋白的直系同源物,该采用什么样的序列分析工具。
采用tblastn序列分析工具。
5 通过BLAST比对,发现两个序列相似度是90%,能不能认定两个序列同源性是90%,为什么。
不能,因为同源性是序列同源或者不同源的一种论断,而相似性或者一致性是一个序列相关性的量化,是两个不同的概念。
5 在NCBI中检索的时候,在检索框中输入“AAO41714[ACCN]”能返回一个怎样的结果?
返回唯一一条序列号为AA41714的相关信息。
6 对核酸序列进行BLAST的时候,选择的字(WORD)越长精度越高还是越短精度越高,为什么?搜索速度跟字长有什么关系?
字越长精度越高。因为blast程序在进行序列数据库相似性搜索时,查询序列可选择过滤掉低复杂度的区域,然后按字长参数(DNA序列一般为11,蛋白质一般为3)将序列分解成小的字串。然后程序再找出查询序列和目标序列间所有单个或多个连续匹配的字串。字串越长,所要求匹配的序列越长,所要求序列的匹配度越高,所以越精确。
增加字长可以提高搜索的特异性和速度。
7这是某蛋白质的一个pattern:GXW[YF][EA][IVLM],请说明其含义 。
Gly-any-Trp-[Tyr or Phe]-[Glu or Ala]-[Ile or Val or Leu or Met]
PA [AC]-x-V-x(4)-{ED}: [Ala or Cys]-any-Val-any-any-any-any-{any but Glu or Asp} PA A-x-[ST](2)-x(0,1)-V. Ala-any-[Ser or Thr]-[Ser or Thr]-(any or none)-Val
8简单介绍NCBI Reference Sequences数据库(其他上课讲过的如PROSITE数据库等 )。
The Reference Sequence (RefSeq) collection aims to provide a comprehensive, integrated, non-redundant, well-annotated set of sequences, including genomic DNA, transcripts, and proteins. RefSeq is a foundation for medical, functional, and diversity studies; they provide a stable reference for genome annotation, gene identification and characterization, mutation and polymorphism analysis (especially RefSeqGene records), expression s
原创力文档

文档评论(0)