- 0
- 0
- 约2.03万字
- 约 27页
- 2026-03-09 发布于河南
- 举报
生物信息学研究员面试题(某大型集团公司)题库应答
技巧
面试问答题(共15题)
第一题
假设你接收到一个项目,目标是分析来自一项全基因组关联研究(GWAS)的巨大数
据集,以探究某种复杂疾病(例如:阿尔茨海默症)的潜在遗传风险因素。这个数据集
包含来自数千个受试者的基因型数据(例如:使用3000GenomesProject的参考面板)、
相应的表型数据(疾病状态,年龄,性别,以及其他可能的混杂因素)以及潜在的样本
队列信息。请描述你将采取的分析流程,并列出其中关键步骤涉及的主要生物信息学和
统计学方法。
答案:
分析流程概述:
1.数据质控与准备(DataQualityControlandPreparation):
•合并数据:将基因型数据、表型数据和样本队列信息按受试者ID进行合并。
•基因型质控:对基因型数据进行质控,包括:
•CallingQuality:过滤掉质量得分低的SNP。
•HeterozygosityRate:过滤掉群体杂合度异常的样本。
•MissingRate:设置SNP缺失率阈值,过滤掉缺失值过多的
原创力文档

文档评论(0)