基于关联或连锁不平衡地分析方法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联或连锁不平衡的分析方法 中山大学公共卫生学院医学统计与流行病学系 李彩霞 博士 licx@mail.sysu.edu.cn (02083 (引用时请注明资料来源以及作者信息) 如果两个基因座上的等位基因是随机关联的,即不独立,这种情况就叫做等位基因关联(allelic association)或者连锁不平衡(linkage disequilibrium,LD)。关联通常反映了分子标记与性状功能突变之间在统计学上的非独立性(连锁不平衡),但并不一定意味着因果关系。 如果一个群体在初始状态下连锁不平衡(δ0≠0),在随机婚配条件下,在n代以后,有δn=(1-θ)nδ0。因此连锁不平衡状态随着代数增加逐渐演变为平衡状态。当连锁很弱,即重组率θ很大(接近1/2)时,连锁不平衡参数将随着代数的增加而迅速减小。如果两个基因座紧密连锁,重组率θ很小(接近0),则不平衡状态将持续很多代。 连锁分析考察重组,因此,考察连锁必须有家庭数据,而由等位基因关联性(或连锁不平衡性)可以由一般的群体数据观察到,有的连锁不平衡现象可能是因为群体混杂造成的,但过大的连锁不平衡通常被视为紧密连锁的证据。传统的连锁分析的结果通常是将基因定位在较大(例如~30cM)的基因组区域,而连锁不平衡被视为一种精细定位的方法。Ott(1999)指出,对于那些远系繁殖的大群体,连锁不平衡通常只能延伸到0.3cM。 群体关联分析 传统的病例-对照研究是基于群体而非家系的疾病关联分析,它通过随机选择病例和对照,然后比较其在标记等位基因和基因型频率上的差异来说明位点与疾病的关联性。其缺点是:阳性结果可能由混杂因素造成,如不同分层人群(stratified populations)混杂在一起造成的虚假联系。为了克服不同分层人群混杂的影响,相应产生了基于家庭的病例-对照研究方法。 单倍型相对风险分析(HRR,haplotype relative risk) 单倍型相对风险分析是基于家系的病例-对照研究方法。例如:假定在一个标记基因座上有两个等位基因,假设确定了n个患病的子女,他们分别来自n个不同的家庭。在这n个家庭中,父母将有4n个标记基因,其中2n个传递给了下一代,构成病例组(受累传递组)个体的基因型;另外2n个没有传递,做为对照组(未传递组)虚拟个体的基因型。通过传统的病例-对照研究,比较传递组与未传递组的标记等位基因和基因型频率是否有差异。因此,基于等位基因的HRR分析的统计表格通常整理为如下格式: 表1 受累传递组与未传递组的等位基因M1和M2的数目 M1 M2 合计 受累传递组 a b 2n 未传递组 c d 2n 合计 a+c b+d 4n 基于基因型的HRR分析的统计表格通常整理为如下格式: 表2 受累传递组与未传递组的基因型的数目 M1M1 M1M2 M2M2 合计 受累传递组 a b c n 未传递组 e f g n 合计 a+c b+f c+g 2n 传递不平衡检验(transmission disequilibrium tests, TDT) 假定在一个疾病基因座上有两个等位基因D1和D2,在标记基因座上有两个等位基因M1和M2。假设确定了n个患病的子女,他们分别来自n个不同的家庭。在这n个家庭中,父母将有4n个标记基因,其中2n个传递给了下一代,另外2n个没有传递。若标记基因座在疾病基因座的附近,且疾病等位基因源于最近的一次基因突变,那么,与疾病等位基因相关联的标记等位基因将以更高的频率出现在患病的个体中(相对于正常个体而言),这个关联的标记等位基因相对于另一个标记等位基因的不平衡传递表明了标记基因座和疾病基因座之间存在连锁与关联。因此,它的统计表格通常整理为如下格式: 表3 n个后代的2n个父母传递和没有传递标记等位基因M1和M2的数目 传递的等位基因 没有传递的等位基因 M1 M2 合计 M1 a b a+b M2 c d c+d 合计 a+c b+d 2n 注意到在上面的2×2表中b代表在标记基因座上基因型为M1M2,传递给后代M1、而没有传递M2的父或母的数目。c代表在标记基因座上基因型为M1M2,传递给后代M2、而没有传递M1的父或母的数目。故Spielman等(1993)(Spielman 和Ewen 1996)提出的传递不平衡检验(TDT)(即配对四格表的Mclemar检验)认为:当b与c相差太悬殊时,便有理由认为标记基因座和疾病基因座之间存在连锁与关联。 基于人类基因组中连锁不平衡的分布以及高度自动化的单核苷酸多态性(SNP)分型技术的发展,TDT法也可用于全基因组扫描分析。 连锁分析、连锁不平衡、关联分析在数量性状上的推广 上面的方法处理

文档评论(0)

feiyang66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档