2025年医学统计与生物信息学考试试题及答案.docxVIP

  • 0
  • 0
  • 约5.93千字
  • 约 15页
  • 2026-02-07 发布于四川
  • 举报

2025年医学统计与生物信息学考试试题及答案.docx

2025年医学统计与生物信息学考试试题及答案

一、单项选择题(每题2分,共20分)

1.某研究欲比较两种降压药物(A药与B药)对高血压患者的疗效,以收缩压下降值(mmHg)为结局指标,两组患者年龄、性别基线均衡。若数据满足正态性和方差齐性,应选择的统计方法是()。

A.配对t检验

B.两独立样本t检验

C.Wilcoxon秩和检验

D.卡方检验

2.在生存分析中,以下哪项不属于删失数据的常见原因?()

A.研究结束时患者仍存活

B.患者因其他疾病死亡

C.患者明确记录的死亡时间

D.患者失访

3.某RNA-seq实验中,某基因在对照组的表达量为(10,12,15),处理组为(25,28,30),若采用DESeq2进行差异表达分析,第一步需要完成的操作是()。

A.计算FPKM值

B.进行批次效应校正

C.估计离散度(Dispersion)

D.构建负二项分布模型

4.在GWAS(全基因组关联研究)中,曼哈顿图的纵坐标通常表示()。

A.基因表达量的对数值

B.SNP的p值的负对数(-log??P)

C.连锁不平衡(LD)系数

D.效应值(β)的绝对值

5.某队列研究中,随访5年发现:暴露于因素X的1000人中,50人发生疾病;未暴露的2000人中,40人发生疾病。则相对危险度(RR)为()。

A.2.5

B.5.0

C.0.5

D.0.25

6.以下哪种方法适用于处理高维生物信息数据中的多重共线性问题?()

A.主成分分析(PCA)

B.卡方检验

C.独立样本t检验

D.Cochrran-Armitage趋势检验

7.在Logistic回归模型中,若某自变量的OR值为2.0(95%CI:1.5-2.5),则正确的解释是()。

A.自变量每增加1单位,疾病发生概率增加2倍

B.自变量每增加1单位,疾病发生的优势比(Odds)增加2倍

C.自变量每增加1单位,疾病发生风险增加200%

D.自变量与疾病无统计学关联

8.某microRNA测序数据中,检测到3000个差异表达的miRNA(p0.05),若采用Benjamini-Hochberg(BH)法校正多重检验,FDR设定为0.05,则最终被认定为显著差异的miRNA数量通常会()。

A.多于3000个

B.等于3000个

C.少于3000个

D.无法确定

9.在生存分析中,Cox比例风险模型的核心假设是()。

A.生存时间服从指数分布

B.风险比(HR)不随时间变化

C.删失数据为完全随机删失(MCAR)

D.自变量与生存时间呈线性关系

10.以下哪项属于生物信息学中“功能富集分析”的常用数据库?()

A.GEO(基因表达综合数据库)

B.KEGG(京都基因与基因组百科全书)

C.TCGA(癌症基因组图谱)

D.dbSNP(单核苷酸多态性数据库)

二、简答题(每题8分,共40分)

1.简述t检验与方差分析的联系与区别。

2.解释“第一类错误(TypeIError)”和“第二类错误(TypeIIError)”的定义,并说明如何通过研究设计降低两类错误的概率。

3.比较RNA-seq数据中RPKM、FPKM与TPM三种标准化方法的异同。

4.简述随机森林(RandomForest)算法在生物信息学中的应用场景及优势。

5.请说明在病例对照研究中使用匹配(Matching)的目的及潜在局限性。

三、计算题(每题10分,共30分)

1.某研究比较两种手术方式(腹腔镜组vs开腹组)的术后住院时间(天),数据如下:

腹腔镜组(n=15):5,6,7,5,8,6,7,9,5,7,6,8,7,6,5

开腹组(n=12):8,9,10,7,11,9,8,10,12,9,8,11

假设数据满足正态性和方差齐性,试计算两组住院时间的均数、标准差,并进行两独立样本t检验(α=0.05),给出结论。

2.某肿瘤随访研究中,5例患者的生存时间(月)及结局(1=死亡,0=删失)如下:

患者1:12(0);患者2:15(1);患者3:20(1);患者4:8(0);患者5:24(1)

试绘制Kaplan-Meier生存曲线,并计算12个月时的生存率(保留3位小数)。

3.某基因表达芯片实验中,检测到1000个基因,其中实际差异表达的基因有200个(真阳性)。若统计分析显示有250个基因被判定为差异表达(包

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档