- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[医药卫生]医学专业生物信息学第15章
删除多态示意 删除多态与老年斑 基因删除对生物学通路影响 适应性拷贝数变化与表型形成 * HAPMAP数据的SNP距离 HAPMAP数据的频率分布 群体SNP分布异质性 从单体型到TagSNP dbGAP中的数据资源 遗传定位部分 复杂疾病与SNP关系 关联研究基本原理 关联分析的结果特点 基因组范围关联研究流程 关联分析进行风险SNP定位 (前列腺癌) 精确定位研究策略 精确定位方法获得高显著SNP 基因组范围关联研究的可视化 随机扰动进行结果校正 关联结果发现SNP影响甘油三酯酸结构 SNP与转录异构 microRNA靶位点多态作用 SNP影响蛋白质功能 数量遗传学部分 数量性状分析的基本流程 线性回归方法研究数量性状定位 系统遗传学的基本原理 人类多态与染色体异常 从QTL到网络到疾病 遗传变异影响表型 酵母的eQTL研究 eQTL的生物学机理 基因组范围eQTL研究 样本数量对QTL影响 系统遗传学部分 微卫星的群体异质性 4.dbSNP与Entrez Gene的交叉引用 (二)关联研究基因型数据的存储与整理dbGap 1. dbGap的主要功能 (1)dbGaP的开发是为了存储和发布基因型和表型相关的研究数据及研究结果。 (2)包括全基因组关联研究、医疗测序、分子诊断化验,以及基因型与非临床性状(数量性状)之间的关联性。 (3)用于高通量、低成本、高效率的分析方法研究,发现海量基因型和表型数据相关性。 2. dbGap中的数据类型 (1)研究文件 包括研究项目的说明,协议文件和数据收集文书。 (2)表型数据 包括在个体水平上的和以摘要形式进行个体的表型信息介绍。 (3)遗传数据 包括研究对象的个体基因型、谱系信息、精细定位结果和重新测序的描述。 (4)统计结果 包括原始的关联或连锁分析获得的结果。 第三节 基于SNP的复杂疾病遗传定位方法 SNP-based complex disease mapping methods 基于群体分子标记频率的统计分析方法进行遗传特性与疾病发生之间的相关性研究,实现疾病基因的染色体定位,不需要先验的生物学知识,是一种强大的疾病基因识别手段。 随着SNP分型技术的发展,SNP作为一种最重要的分子标记,能够应用于孟德尔遗传病的研究,同时被广泛的用来进行复杂疾病的染色体定位。 一、疾病定义与样本选取偏好 1. 临床表型 选取具有典型临床特征和明确诊断依据的个体作为疾病研究对象。 2. 发病年龄 具有早发特征的患病个体更倾向于有较明显的遗传特点。 3. 家族史 有家族史的个体能够较为准确的诊断疾病种类。 4. 严重程度 较为严重的患病个体,具有较明显的遗传特点。 5. 群体分层 选取的研究群体应具有同质性。 二、连锁分析进行风险SNP定位原理 连锁分析(linkage analysis)是根据家系中遗传标记重组率来计算两等位之间距离的方法。 连锁分析主要是通过分析已知的性状或疾病表型与基因型在家系中遗传模式,来定位新的易感位点和易感区域。 连锁分析是用于研究家系中标记传递的一种分析策略,根据连锁分析过程中是否依赖于假设模型,我们将连锁分析方法分为两类:参数连锁分析和非参数连锁分析。 (一)参数连锁分析方法 对于孟德尔遗传病,易于比较清楚的知道该疾病的遗传方式、外显率、基因频率等指标,从而确定一个准确的遗传模型进行连锁分析。 统计方法的发展,某些遗传模型并不清楚的疾病也通过改变策略而适用于连锁分析,但相对准确的模型建立是参数连锁分析成功的基本条件。 直接计分法和LOD值法是最常用的参数连锁定位方法。 这里我们以LOD值法为例对参数连锁分析方法进行简要的介绍: 1. LOD值法进行连锁分析首先针对某一疾病收集一定数量的家系资料进行分离分析,确定遗传模型。 2. 通过文献检索了解其可能的决定性状的染色体区域,并对该区域的SNP进行查询和筛选,基于选定的SNP,对该家系成员进行SNP分型。 3. 通过连锁分析估计疾病与SNP在子代中重组的发生率,计算LOD值,确定重组分数及相应的遗传距离,并进行假设检验,判断易感基因是否与遗传标记连锁。 LOD值是指在一定重组率条件下,两个位点相连锁的似然性和不连锁的似然性比值的对数值,即 在进行连锁分析时,要计算θ=0(不重组)到θ=0.5(随机分配)的一系列LOD得分。 当LOD得分为+3或更大时,肯定连锁;当LOD得分小于或等于-2时,排除连锁。 常用的基于LOD的连锁分析工具有LIPED 、LINKAGE 、S.A.G.E. 等自由软件包 早期的连锁分析方法对模型的依赖性较强,计算速度慢等原因, “混合模型”方法、多位点连锁分析方法、吉布斯取样及蒙特卡罗方法等逐步发展。 参数连锁分析过程中的注意事项: 1. 参数
文档评论(0)