- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多位点单倍体型频率估计-EmpowerStats
多位点单倍体型频率估计
单核苷酸多态性(single nucleotide polymorphism,SNP)主要是指在基
因组水平上由单个核苷酸的变异所引起的DNA 序列的多态性,是人类可遗传的
变异中最常见的一种。而单倍体型 (Haplotype)是指同一条染色体上紧密相
连的一些位点(或基因)的组合。不同位点间排列距离越近,在减数分裂时发
生重组的可能性就越小,以同一单倍体型的整体传递给子代的可能性也就越
大。
SNP 单体型就是指不同SNPs 位点上核苷酸碱基的线性排列,每一种线性排
列称为一种SBP 单体型。例如:如果在某一段DNA 片段上发现了10 个SNPs,
10
理论上可能存在1024 (2 )种单体型,但由于连锁不平衡的存在,实际发现的
单体型的数目远远少于理论上的值。人类绝大多数疾病都存在遗传基础,而其
中许多疾病如高血压和冠心病等并不是由单个SNP 位点的突变引起的,而是由
若干个位点上的SNPs 联合作用导致的,亦即SNP 单体型是影响疾病发生的遗传
单位。
单倍体型分析可以帮助研究者进一步验证在连锁分析中所取得的数据,排
除假阳性;通过多个位点的单倍体型排列,还可以使某些多态性不够充分的单
个位点的信息得以应用,多位点单体型分析能够发现单体型-疾病表型之间明显
强于单个位点-疾病表型的关联。单倍体型分析含有较大的信息量,而且充分考
虑多个位点连锁不平衡的信息,被证明是一条便捷、有效的候选基因分析方
法。
研究者在处理SNP 单体型数据时,常常需要估计单倍体型的频率。易侕的
多位点单倍体型频率估计模块采用R 里的最大似然估计法估计单倍体型频率。
例 1,某研究选取血管紧张素原(angiotensinogen, AGT)基因启动子-
217,-152,-20,-6, 内含子1 的+31,共5 个位点,对100 例正常人进行了
SNP 位点基因型检测,点击这里下载数据,其中0,1,2 分别代表5 个位点的基
因型:G217-A 为AA,AG 和GG;G152-A 为AA,AG 和GG,A-20C 为AA,AC 和
CC,A-6G 为AA,AG 和GG,C+31T 为CC,CT 和TT,试求得可能存在的单体型,
并计算 单体型概率。
输入界面:
如果原始数据中是基因型变量,则应该在“基因型/等位基因变量类型”下
选择“1:基因型(每个变量代表一个基因)”;如果是等位基因变量,则应该选
择“2:等位基因(按顺序2 个变量代表一个基因)”。
输出结果:
单倍体型频率估计
# 单倍体型编码 G217.A G152.A A.20C A.6G C.31T 频率
1 1 1 1 1 1 1 0.5447129
2 3 1 1 1 2 1 0.1263794
3 2 1 1 1 1 2 0.0972353
4 9 1 2 1 1 2 0.0443125
5 17 2 1 2 2 2 0.0374048
6 16 2 1 2 2 1 0.0312797
7 5 1 1 2 1 1 0.0273825
8 11 2 1 1 1 1 0.0163130
9 15 2 1 2 1 2 0.0155047
10 14 2 1 2 1 1 0.0144343
11 13 2 1 1 2 2 0.0107744
12 4 1 1 1 2 2 0.0102960
13 7 1 1 2 2 1 0.0088381
文档评论(0)