2026年生物信息分析师考试题库(附答案和详细解析)(0127).docxVIP

  • 0
  • 0
  • 约7.81千字
  • 约 11页
  • 2026-02-12 发布于上海
  • 举报

2026年生物信息分析师考试题库(附答案和详细解析)(0127).docx

生物信息分析师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪种文件格式是高通量测序原始数据的标准存储格式?

A.FASTA(三行结构:ID、序列、质量值)

B.BAM(文本格式,包含比对信息)

C.FASTQ(四行结构:序列ID、序列、质量ID、质量值)

D.VCF(存储基因表达量数据)

答案:C

解析:FASTQ是NGS原始数据的标准格式,每行四部分(序列ID、序列、质量标识行、质量值)。A错误,FASTA无质量值;B错误,BAM是SAM的二进制压缩格式;D错误,VCF存储变异信息。

常用于全基因组重测序数据比对的工具是?

A.BWA-MEM

B.Salmon

C.HISAT2

D.MetaPhlAn

答案:A

解析:BWA-MEM是经典的短读长比对工具,适用于基因组重测序。B(Salmon)用于RNA-seq定量;C(HISAT2)用于RNA-seq比对;D(MetaPhlAn)用于宏基因组物种分类。

以下哪个数据库主要存储蛋白质三维结构信息?

A.NCBIGenBank

B.UniProt

C.PDB(ProteinDataBank)

D.Ensembl

答案:C

解析:PDB专门存储蛋白质和核酸的三维结构。A(GenBank)存储核酸序列;B(UniProt)存储蛋白质序列及功能;D(Ensembl)存储基因组注释。

质量值Q30表示测序错误率约为?

A.1%

B.0.1%

C.0.01%

D.10%

答案:B

解析:Phred质量值公式为Q=-10log??(P),Q30对应错误率P=10^(-3)=0.1%。

用于检测单核苷酸变异(SNP)的主流工具是?

A.GATKHaplotypeCaller

B.Canu

C.BLAST

D.DESeq2

答案:A

解析:GATK是变异检测的金标准工具。B(Canu)用于三代测序组装;C(BLAST)用于序列比对;D(DESeq2)用于RNA-seq差异分析。

长读长测序技术(如PacBio)的主要优势是?

A.测序成本低

B.读长更长(可达数万碱基)

C.错误率更低

D.适合小片段文库构建

答案:B

解析:三代测序(如PacBio)的核心优势是超长读长(10-100kb),但错误率较高(~15%),成本也高于二代。

以下哪种工具用于基因功能富集分析?

A.DAVID

B.Trimmomatic

C.Bowtie2

D.SPAdes

答案:A

解析:DAVID是经典的功能富集分析工具,支持GO、KEGG等数据库。B(Trimmomatic)用于质控;C(Bowtie2)用于比对;D(SPAdes)用于基因组组装。

单细胞RNA-seq数据中“UMI(唯一分子标识符)”的主要作用是?

A.减少扩增偏倚

B.提高测序读长

C.增加测序通量

D.降低测序错误率

答案:A

解析:UMI通过标记原始RNA分子,可校正PCR扩增过程中的偏倚,准确定量基因表达。

系统发育树构建中,Bootstrap值(通常取1000次重复)的意义是?

A.表示树的分支长度

B.评估分支的统计学支持度(值越高越可靠)

C.反映物种间的遗传距离

D.标识树的根节点位置

答案:B

解析:Bootstrap值通过重采样评估分支的可信度,通常70表示可信,90表示高度可信。

宏基因组学研究中,“分箱(Binning)”的目的是?

A.去除测序接头

B.将reads组装成contig

C.从混合序列中区分不同微生物的基因组

D.统计物种相对丰度

答案:C

解析:分箱通过序列组成(如GC含量、k-mer频率)或覆盖度差异,将混合的宏基因组序列分配到不同微生物的基因组中。

二、多项选择题(共10题,每题2分,共20分)

以下属于NGS(二代测序)标准分析流程的步骤有?

A.原始数据质量控制(QC)

B.测序读长与参考基因组比对(Mapping)

C.蛋白质三维结构预测

D.基因组变异检测(VariantCalling)

答案:ABD

解析:NGS标准流程包括质控(A)、比对(B)、变异检测(D);C(结构预测)属于蛋白质组学分析,非NGS核心流程。

FASTQ文件质量评估的关键指标包括?

A.平均Phred质量值(如Q20/Q30比例)

B.GC含量分布

C.接头序列污染比例

D.蛋白质分子量

答案:ABC

解析:FASTQ质控关注序列质量(A)、碱基组成(B)、接头污染(C);D(分子量)是蛋白质特性,与核酸无关。

以下可用于三代测序(长读长)基因组组装的工具是?

A.Canu

B.Flye

C.SOAPdenovo

D.SPAdes

答案:AB

解析:Canu和Flye专门优化长读

文档评论(0)

1亿VIP精品文档

相关文档