人类群体遗传学第一讲.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人类群体遗传学第一讲

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 亚群体(sub-population) 以上考虑的是一个简单的群体,不论其是否近亲交配。 然而,实际上大多数的自然群体可被再分为许多不同的繁殖单位或亚群体(sub-population),尽管这些群体并不是完全隔离的。这种情况下,研究群体内和群体间的遗传变异就显得十分重要。 可再分群体中的基因型频率 假定一个群体可分为s个亚群体,每一个亚群体都满足Hardy-Weiberg平衡。设xk为第k个亚群体中等位基因A1的频率,则基因型A1A1,A1A2,A2A2的频率分别为 我们用wk来表示第k个亚群体的相对大小,且总和为1。则A1A1,A1A2,A2A2在整个群体中的频率为: 其中 和 是亚群体中等位基因频率的均值和方差。 可再分群体中的固定指数 比较 我们知道 ,因此 表明如果一个群体被分为多个交配单位,纯合子的频率要高于Hardy-Weinberg比率。这个性质首先由Wahlund(1928)发现,被称为Wahlund定律,也称Wahlund现象。 当等位基因频率在所有亚群体中一致时,F为0;而当每个亚群体都被固定为某一个等位基因时,F为1。 HWE的偏离(Wahlund定律) Wahlund现象的启示 群体结构(population structure)的存在! 反之,当F为负值的时候, 杂合子频率比Hardy-Weinberg平衡时预期的要高,意味着杂合优势,某种程度的自然选择发生。 杂合优势与平衡选择(后面“自然选择”章节细谈) 检验HWE的常用方法 X2-test 观察值 期望值 实例 例 MN血型基因频率的计算 血型 基因型 人数(O) LM LN 预期值 ( C ) M LMLM 397 794   1788×p2=382.96 MN LMLN 861 861 861 1788×2pq=889.05 N LNLN 530   1060 1788×q2=515.99 合计   1788 1855 1921 1788   p=0.4628 q=1-p=0.5372 结论:三个基因型频率的观察值与HWE定律所期望的频率没有显著差异。 精确检验 AA AB BB nAA nAB nBB N Am.J.Hum.Genet 2005, 76:887-893 HWE在复杂疾病遗传研究中的应用 数据分析中,检测可能的数据质量问题(typing error)。 Case-control study 一般要求所有检测位点在control中处于HWE。 多个位点处于HWD暗示近亲婚配或群体结构的存在。 在排除其他可能的因素以后,筛选可能受到自然选择的基因。 全基因组数据中的HWE检验问题 Affymetrix 500K, Illumina 650K… 多重检验(multiple testing)问题 If you have 10,000 genes in your genome, and perform a statistical analysis, a p-value cutoff of 0.05 allows a 5% chance of error. That means that 500 genes out of 10,000 could be found to be significant by chance alone. 多重检验校正方法 Bonferroni correction Bonferroni Step-down (Holm) correction Westfall and Young Permutation Benjamini and Hochberg False Discovery Rate Bonferroni correction The p-value of each gene is multiplied by the number of genes in the gene list. If the corrected p-value is still below the error rate, the gene will be significant: Corrected P-value= p-value * n (number of genes in test) 0.05 As a consequence, if testing 1000 genes at a time, the highest accepted individual p-value is 0.00005, making the correction very stringent.

您可能关注的文档

文档评论(0)

sunshaoying + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档