- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
最大似然法及方根法计算HLA
最大似然法和方根法计算HLA?三座位单体型频率的比较
来源:本站原创 作者: HYPERLINK /ShowAuthor.asp?ChannelID=1001AuthorName=王珏1?罗玫1?邹海2?甘静2?李星洁2?陈强1,2?郑忠伟1,(1.中国医学科学院%20北京协和医学院%20输血研究所%20四川%20成都2.四川省脐带血造血干细胞库) \o 王珏1?罗玫1?邹海2?甘静2?李星洁2?陈强1,2?郑忠伟1,(1.中国医学科学院 北京协和医学院 输血研究所 四川 成都 610081;2.四川省脐带血造血干细胞库) 王珏1?罗玫1?邹海2?甘静2?李星洁2?陈强1,2?郑忠伟1,(1.中国医学科学院?北京协和医学… 发布时间:2009-9-21
?HLA是至今所知的人类最为复杂的遗传多态系统,由一系列紧密连锁的基因座位组成,其中经典的HLA?Ⅰ,Ⅱ类位点上有极其多样的等位基因。HLA的遗传特点包括以单体型形式进行遗传,共显性遗传以及连锁不平衡。单体型是指HLA等位基因在一条染色体上的组合方式。连锁不平衡是指组成单体型的HLA等位基因并非随机组合,某些等位基因(如中国人中的A2,B46)经常同时出现,实际观察到的单体型频率显著高于按照随机组合计算得到的频率;另一些等位基因组合又较少出现,实际频率少于随机组合频率。这些不同的单体型在不同人群中的分布往往差异较大[1]。而准确可靠地计算人群中的单体型频率对估计在骨髓库中找到某特定表型供者的概率,对指导患者查询供者,以及计算捐赠者资料库的最佳库容量都是至关重要的[2]。目前,根据人群的HLA表型资料计算其中单体型频率的方法主要为方根法[3]和最大似然法(expectationmaximization,EM)[4]。但是目前尚无研究比较这2种方法计算HLAABDR三座位单体型的准确性,尤其是计算小群体中三座位单体型的准确性。我们即对该问题作一探讨。1?材料与方法 1.1?HLA资料来源?家系资料来源于2002—2009年在本实验室进行HLA分型的家庭。选择父母和子女中至少各有1人进行了HLAA,B, DR 3个位点分型的家庭100个。在这些家系中各选择1个个体组成标本量为100例的无关群体。在中华骨髓库四川分库中选择2004—2006年入库的8 933个标本作为大样本量的无关群体。分型结果均为裂解抗原水平。如果某位点上只检出1个抗原,做纯合子处理,不考虑空白基因。1.2?HardyWeinberg平衡检验?采用Arlequin软件(v3.1)[5],以Markov chain确切法检验,参数采用默认设置。1.3?频率可靠性估计?要得到可靠的单体型频率,必须要有一定数量的群体。对给定的单体型频率,其要求的最小样本量计算如下:设单体型A的频率为HF,在人群中带有该单体型个体的频率则为2HF×(1-HF)+HF2,不带该单体型个体的频率为(1-HF)2。在样本量为n的人群中,单体型A至少出现1次的概率P等于1减去没有发现该单体型的概率,即P=1-[(1-HF)2]n。如果设置P为0.95,则有0.05=(1-HF)2n,即n=-1301 0/2log(1-HF)。根据同一公式,可以计算出对于一定样本量的群体,单体型频率的最低可靠值。1.4?单体型计算1.4.1?家系分析?本研究选择的家系中,父母和子女至少各有1人进行了HLAA、B、DR三位点的分型,根据亲代子代间的孟德尔遗传规律推断HLA单体型。以直接计数法计算其相应的单体型频率,HF=x/2n(x为发现的单体型数,n为个体数)。1.4.2?EM法?该方法通过一系列的迭代过程,从多座位的表型数据估计最可能的单体型频率。其主要过程是首先随机假设1组单体型频率,然后根据HardyWeinberg平衡计算出相应的基因型频率,再根据计算结果对原始单体型频率进行修正,得到第2组单体型频率。这组频率用于下一轮计算、修正后得到第3组频率。经过一定次数的迭代;或者单体型频率达到平衡后,即前后2次得到的单体型频率之差<某一给定数值(ε)时;计算结束。本文的EM法采用Arlequin V3.1完成,迭代次数设置为5 000次,停止迭代条件ε= 1×10-7;输出的最低频率为1×10-5。1.4.3?方根法?方根法的基本原理是根据HardyWeinberg定律,由表型频率推导出单体型频率。设基因I,J,K在群体中的分布如表1。本文的方根法通过自编程序dbx完成。
表1?基因I,J,K在人群中的分布
?
I+J+ I+J- I-J+ I-J- K+ n1 n3 n5 n7 K- n2 n4 n6 n8注:n1—n8代表相应的表型频率???? 则单体型
文档评论(0)