具有遗传性疾病和性状遗传位点分析研究化.pdfVIP

具有遗传性疾病和性状遗传位点分析研究化.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
参赛密码 (由组委会填写) “华为杯”第十三届全国研究生 “华为杯”第十三届全国研究生 数学建模竞赛 数学建模竞赛 学 校 北京邮电大学 参赛队号 1. 贾培栋 队员姓名 2. 赵 娟 3. 于淑月 - 1 - 参赛密码 (由组委会填写) “华为杯”第十三届全国研究生 “华为杯”第十三届全国研究生 数学建模竞赛 数学建模竞赛 题 目 具有遗传性疾病和性状的遗传位点分析 摘 要: 本文采用全基因组关联性分析的方法来定位与性状或疾病相关联的位点在 染色体或基因中的位置,针对相应的数据结构建立多种数学模型:卡方检验 (Chi-square test )、多元线性回归模型 (multiple linear regression model )、 典型相关分析 (canonical correlation analysis )等等,并综合利用这几种方法 完成了数据的处理。 问题一,每个位点由两种碱基组成,四种碱基共构成6 种位点类型 (A/T, A/G,A/C,G / T,C/T,C/G ),每种位点类型共有三种编码方式。位点只与三 种编码方式的构成比例和位点类型有关系,与位点内碱基对与顺序、位置无关, 所以六种类型都可以由A/B 表示,三种编码方式AA 、AB 、BB 可以分别编码 为0、1、2 。 问题二,认为每个位点相互独立,并且不考虑基因的存在,位点与患病之 间具有直接关系。样本分为患病组和对照组两组,如果某个位点与患病相关, 那么编码方式应该有明显的差异,利用卡方检验和显著性分析来衡量差异。将 患病组和对照组的差异性作为衡量位点和患病关联强度的指标。患病组和对照 组之间的差异性可以用卡方值来表示,卡方值越大,差异性越大,位点与患病 之间关联强度越强。利用Bonferroni 校正,得到一个比较保守的结论,与患病 最相关的位点是rs2273298 。 问题三,为了简化基因与患病的关系,假设基因与患病之间是简单相关, 即拥有患病基因就会导致患病,基因内的位点与患病进行多元线性回归分析和 显著性检验,利用线性回归分析的残差和显著性强度综合衡量基因与患病之间 - 2 - 的关系。如果残差越小并且显著性水平高,基因与患病之间的关联越强,与患 病关联最强的基因是Gene102 和Gene217 。 问题四,首先需要分析多种性状进行初步统计,发现性状之间的具有很强 的相关性,可以进一步降低性状的维度。然后筛选与性状无关的性状,降低位 点的维度,得到候选名单,为下一步计算做准备。最后,问题转化为多个性状 与候选名单内的位点之间的关系。由于多个性状是一个整体,不可分割,相当 于求全局最优解,采用典型相关分析,求解其中的典型关系,认为回归直线的 系数比较大的位点对性状具有比较大的影响,并运用显著性检验进行验证,确 保假设成立。找到与10 个性状相

文档评论(0)

peace0308 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档