具有遗传性疾病和性状的遗传位点分析 (3).pdfVIP

  • 3
  • 0
  • 约5.09万字
  • 约 33页
  • 2019-09-13 发布于江苏
  • 举报

具有遗传性疾病和性状的遗传位点分析 (3).pdf

参赛密码 (由组委会填写 ) “华为杯”第十三届全国研究生 “华为杯”第十三届全国研究生 数学建模竞赛 数学建模竞赛 题 目 具有遗传性疾病和性状的遗传位点分析 摘 要 : 大量研究表明,人体的许多表型性状差异以及对药物和疾病的易感性等都 可能与某些位点相关联,或和包含有多个位点的基因相关联。因此,定位与性 状或疾病相关联的位点在染色体或基因中的位置,能帮助研究人员了解性状和 一些疾病的遗传机理,也能使人们对致病位点加以干预,防止一些遗传病的发 生。 对于问题一,根据位点中碱基对的特征,基于生物基因的加性效应,位点 中的三种组合分别可编码为0、1,、2,其中1代表杂合子基因,0和2分别代 表纯合子基因中的主要等位基因(major allele)与次要等位基因(minor allele)。 对于问题二,需通过一定方法计算出每个位点与疾病之间的关联程度,本 文首先通过卡方检验进行建模,并且分别用BenjaminiHochberg (下简称BH 校正)和Bonferroni校正 (下简称BONF校正)P值。阈值为经过校正后P值 小于 0.05。满足阈值的致病相关位点为 rs2273298 (BH 校正后 p 值为 0.0006024;BONF校正后P值为0.0006024)。除此之外,还采用置换检验模型和 贝叶斯模型进行检验,检测出来最显著的致病位点与卡方检验相一致,因此最 终得出与疾病相关的位点有一个,位点名称为:rs2273298 (置换检验模型校正 后p值为0.009445,贝叶斯因子的对数取值为4.51238)。 对于问题三,根据基因可以表示为位点的集合这一特征,本文采用 Set-based test和VEGAS模型对一个基因内连锁不平衡的SNP位点进行建模, 并且都采用置换算法进行模型求解,阈值为经过BH校正后P值小于0.05,最 - 2 - 终两个模型得到了一致且较好的效果。与疾病相关联的基因有三个,基因所属 序列为:gene_55、gene_102、gene_217 (Set-basedtest模型BH校正P值后 分别为 0.149985,0.04,0.149985 ;VEGAS 模型 BH 校正后 P 值分别为 0.00165,0.0184,0.0009)。 对于问题四,多个性状往往表现为一个整体来进行衡量,本文分别采用 mv-plink模型和MultiPhen模型对多个表型之间的关联进行建模,并且找出这 些关联表型的致病位点。阈值选取为经过BH校正后P值小于0.05。最终两个 模型都得出与样本中十个性状有关联的位点有一个,位点名称为:r (mv-plink模型 BH校正后P值为2.8684471020 ;MultiPhen模型BH校正后 P值为8.306198102 1 )。 关键词:遗传统计学, 全基因组关联性分析(GWAS),位点(SNPs) ,卡方 检验 - 3 - 目 录 一、 问题描述- 5 - 二、 合理假设与符号说明 - 7 - 2.1 合理假设- 7 - 2.2 符号说明- 7 - 三、 问题分析- 8 - 3.1 问题一- 8 - 3.2 问题二- 8 - 3.3 问题三- 8 - 3.4 问题四- 8 - 四、 模型特点介绍- 9 - 4.1问题二的建模- 9 -

文档评论(0)

1亿VIP精品文档

相关文档