- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2025年生物信息分析师考试题库(附答案和详细解析)(0910)
生物信息分析师考试试卷
(考试时长:120分钟)
一、单项选择题(共10题,每题1分,共10分)
以下哪种测序技术属于第二代高通量测序技术?
A.Sanger测序
B.IlluminaSolexa
C.PacificBiosciencesSMRT
D.OxfordNanopore
答案:B
解析:
IlluminaSolexa使用边合成边测序(SequencingbySynthesis,SBS)原理,属于第二代测序技术。
A是第一代,C/D属于第三代单分子测序。
BLAST算法中,衡量序列相似性显著性的指标是:
A.E-value
B.Identity
C.Coverage
D.Bit-score
答案:A
解析:
E-value表示随机匹配的可能性,值越小表示相似性越显著(通常0.05)。
Identity为序列一致性百分比,Coverage为覆盖度,Bit-score为比对得分。
(题目3-10略,格式同上)
二、多项选择题(共10题,每题2分,共20分)
以下哪些是序列比对的常用工具?(至少2个正确)
A.BLAST
B.BWA
C.Tableau
D.Bowtie
答案:ABD
解析:
A/B/D均为序列比对工具(BLAST用于同源序列搜索,BWA/Bowtie用于NGS比对)。
C是数据可视化工具,与比对无关。
以下关于FASTQ格式的描述,正确的是:
A.包含序列和质量信息
B.质量值采用ASCII编码
C.每条记录有3行
D.质量行允许空格分隔
答案:AB
解析:
FASTQ包含序列行和质量行(共4行),质量值用ASCII码表示(如Phred+33),不允许空格分隔。
(题目3-10略,格式同上)
三、判断题(共10题,每题1分,共10分)
SAM文件是二进制格式,需要通过samtools转换为BAM文件后查看。
答案:错误
解析:SAM为文本格式,BAM是其二进制压缩格式,需用samtoolsview转换后查看。
PCA(主成分分析)可完全避免GWAS中的群体分层问题。
答案:错误
解析:PCA可减少群体分层影响,但无法完全消除,需结合其他模型(如线性混合模型)。
(题目3-10略,格式同上)
四、简答题(共5题,每题6分,共30分)
简述NGS数据分析中接头(Adapter)去除的必要性及常用工具。
答案:
第一,必要性:接头序列会干扰比对和组装,导致错误结果;
第二,常用工具:Cutadapt、Trimmomatic。
解析:
接头是测序引物残留序列,未去除会导致比对失败(如定位至错误染色体)。
Cutadapt通过序列匹配修剪,Trimmomatic还可进行质量过滤。
说明基因组注释(GenomeAnnotation)的两大核心内容。
答案:
第一,结构注释:识别基因位置(外显子/内含子边界);
第二,功能注释:预测基因功能(如蛋白结构域、GO术语)。
解析:
结构注释依赖基因预测算法(如Augustus),功能注释需结合同源比对(如InterProScan)。
(题目3-5略,格式同上)
五、论述题(共3题,每题10分,共30分)
论述GWAS(全基因组关联分析)的步骤,并结合实例说明其挑战。
答案:
步骤:
①样本分型与质控(MAF过滤、哈迪温伯格平衡检验);
②表型标准化;
③关联分析(如线性回归模型);
④多重检验校正(Bonferroni或FDR)。
挑战实例:
群体分层:欧洲人群样本中身高关联位点可能反映族群差异(需用PCA校正);
效应量小:糖尿病关联位点OR值常1.2,需大样本验证(如UKBiobank)。
解析:
案例结合人类复杂疾病(如2型糖尿病),说明假阳性控制需统计学和生物学验证。
分析RNA-seq差异表达流程中,DESeq2与FPKM/RPKM标准化方法的区别及适用场景。
答案:
DESeq2:
基于负二项分布模型,使用几何均值标准化(缩放因子法);
优势:考虑离散度,适合小样本、低表达基因。
FPKM/RPKM:
仅标准化基因长度和测序深度;
缺陷:忽略组成偏差(如高表达基因影响全局)。
适用场景:
DESeq2用于严格差异分析(如癌症vs正常组织);
FPKM/RPKM适用于跨样本表达水平比较(避免长度偏差)。
解析:
结合TCGA数据案例,说明DESeq2对批次效应更鲁棒。
(题目3略,格式同上)
您可能关注的文档
- 2025年志愿服务管理师考试题库(附答案和详细解析)(0910).docx
- 2025年智能交通系统工程师考试题库(附答案和详细解析)(0908).docx
- 2025年注册财富管理师(CWM)考试题库(附答案和详细解析)(0911).docx
- 2025年注册测绘师考试题库(附答案和详细解析)(0911).docx
- 2025年注册船舶工程师考试题库(附答案和详细解析)(0908).docx
- 2025年注册电气设备评估师考试题库(附答案和详细解析)(0911).docx
- 2025年注册动画设计师考试题库(附答案和详细解析)(0909).docx
- 2025年注册工业设计师考试题库(附答案和详细解析)(0910).docx
- 2025年注册环保工程师考试题库(附答案和详细解析)(0910).docx
- 2025年注册土木工程师考试题库(附答案和详细解析)(0910).docx
文档评论(0)