一种利用机器学习策略提高复杂性状全基因组预测准确性及计算效率的方法开发.pdfVIP

  • 135
  • 0
  • 约11.31万字
  • 约 71页
  • 2021-01-09 发布于江苏
  • 举报

一种利用机器学习策略提高复杂性状全基因组预测准确性及计算效率的方法开发.pdf

一种利用机器学习策略高复杂性状全基因组预测准确性及计算效率的算法开发 目 录 摘 要i ABSTRACT iii 缩略词表(ABBREVIATIONS )v 1 前言 1 1.1 研究问题的由来 1 1.2 文献综述 2 1.2.1 全基因组预测的发展历程2 1.2.2 基于亲缘关系的 BLUP 方法研究进展 5 1.2.3 基于标记效应的 Bayes 方法研究进展8 1.3 本研究目的和意义 11 2 材料与方法 11 2.1 群体数据 11 2.1.1 表型数据的介绍与来源 11 2.1.2 基因型数据的介绍及质量控制 13 2.2 性状的模拟方法 13 2.3 预测准确性的计算方法 14 2.4 用于对比的方法及所选缘由 14 2.4.1 LMM 15 2.4.2 BSLMM 16 2.4.3 BayesR 16 2.5 KAML 模型 18 2.5.1 协变量 QTNs 的选择20 2.5.2 网格搜索及二分法迭代21 2.5.3 KAML 中的方差组分估计方法 23 2.5.4 KAML 软件的开发与安装使用 24 3 结果25 3.1 MKL 与 OpenMP 并行加速 25 3.2 不同遗传构建下 KAML 模型集合 27 3.3 模拟性状下的表现28 I 华中农业大学 2020 届博士研究生学位(毕业)论文 3.3.1 基于人类基因型的模拟性状 28 3.3.2 QTL-MAS-2012 公开模拟数据集 31 3.4 人类疾病数据下的表现 32 3.4.1 各性状的述性统计 32 3.4.2 各性状的估计遗传力 32 3.4.3 一般线性模型关联分析结果 33 3.4.4 不同方法预测准确性及计算效率的比较 34 3.4.5 不同关联分析模型及教程验证次数对 KAML 的影响 37 3.5 多物种不同性状数据下的表现 39 3.5.1 各性状的述性统计 39 3.5.2 各性状的遗传力估计 40 3.5.3 混合模型关联分析结果 40 3.5.4 不同方法预测准确性及计算效率的比较 41 3.5.5 贝叶斯模型迭代次数对准确性的影响 44 3.6 基于预估参数的 KAML 方法准确性和计算效率 46 3.7 KAML 与一步法策略的整合 48 4 讨论 51 4.1 群体大小对 KMAL 的影响 51 4.2 关联分析模型对 KAML 的影响 51 4.3 交叉验证过程对 KAML 的影响 52 4.4 整合多组学数据高预测准确性 53 4.5 KAML 模型的局限性 53 5 小结 54 5.1 本研究的结论 54 5.2 本研究的创新点 54 5.3 本研究的不足之处及进一步工作建议 55 参考文献 57 附录 1 在读期间发表论文情况 67 附录2 在读期间开发软件简介 69 致谢 71 II 一种利用机器学习策略高复杂性状全基因组预测准确性及计算效率的算法开发 摘 要 全基因组预测是一种利用覆盖全基因组标记预测未知表型的新兴技术,随着 测序技术的不断更新和日趋成熟,基因分型成本越来越低,全基因组预

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档