【生物信息学第二版】复杂疾病分子特征和计算分析.ppt

下载文档 降价啦

27
0
约8.45千字
约 100页
2018-05-16 发布于福建
举报
版权申诉
保障服务

【生物信息学第二版】复杂疾病分子特征和计算分析.ppt

1、本文档共100页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

常见疾病-常见变异（common disease-common variant）假说：复杂疾病是由多个常见变异共同作用的结果，这些常见变异是微效的，多个微效常见变异的累积引起疾病的发生。多重罕见变异（multiple rare variant）假说：疾病的发生取决于一些效应较大的罕见变异。（一）单位点分析方法病例-对照的数据即采用?2检验、Fisher精确检验、Cochran- Armitage趋势检验和逻辑回归分析；数量性状则采用方差分析、t检验、线性回归分析等（二）多位点分析方法（三）折叠方法（collapsing methods） Fisher方法、Hotelling?T2检验、多元回归分析（线性或逻辑）等第四节常用的集成软件工具（Statistical Genetics Softwares and Application）实验内容常用的集成软件工具（Molecular Characters and Data of Complex Disease）一、Haploview与单体型分析二、Plink软件包与基因互作三、SNPtest的使用及Meta分析四、Merlin与数量性状分析小结复杂疾病的分子特征遗传和环境因素共同决定多基因决定单核苷酸多态性连锁不平衡单体型常用复杂疾病相关数据库 OMIM dbGap CGAP HGMD GeneCards 复杂疾病遗传学研究方法连锁分析参数连锁分析非参数连锁分析关联分析质量性状关联分析数量性状关联分析常用集成软件工具 Haploview Plink SNPtest Meta Merlin * * * * * * * * * * * * * （八）下一代测序（the next-generation sequencing，NGS）目前常用的NGS技术包括454、Solexa和SOLID等，它们均利用当前的智能化技术对基因组进行测序。 NGS适合用于全基因组测序、全外显子测序或对某一段区域进行靶向测序（targeted sequencing）。二、遗传定位研究中的实验设计与统计分析方法（一）遗传定位研究的分子基础连锁不平衡（linkage disequilibrium，LD）：指相邻基因座上等位基因的非随机相关。导致连锁不平衡的主要因素：遗传漂变、人口增长与群体结构改变、重组率变化、突变率变化、基因转换。连锁不平衡的量度常用连锁不平衡量度方法：D’、r2和LOD值 r2值：代表两位点在统计学上的关系，其表达式为： r2的数值表示一个位点可反映另一位点信息量的程度， r2 =1称为完全连锁不平衡，这时两位点等位基因频率相同，只观察一个标记即可提供另一个标记的全部信息。 b D’值：又称连锁不平衡系数，其表达式为 : 当D’=1时，说明两个位点间没有发生重组，与r2相比较，当D’等于1时两位点等位基因频率并不需要相同，它只是反映最近一次突变发生后突变位点与临近多态性位点的关系。（二）遗传定位研究中的样本选取 1.临床表型选取具有典型临床特征和明确诊断依据的个体作为疾病研究对象。 2.发病年龄具有早发特征的患病个体更倾向于有较明显的遗传特点。 3.家族史有家族史的个体能够较为准确的诊断疾病种类。 4.严重程度较为严重的患病个体，具有较明显的遗传特点。 5.群体分层选取的研究群体应具有同质性。（三）连锁分析及其统计分析方法连锁分析（linkage analysis）：根据家系中遗传标记重组率计算两等位之间距离的方法。连锁分析主要通过分析已知的性状或疾病表型与基因型在家系中遗传模式，以定位新的易感位点和易感区域。是用于研究家系中标记传递的一种分析策略，根据连锁分析过程中是否依赖于假设模型，连锁分析方法分为两类：参数连锁分析和非参数连锁分析。参数连锁分析所依据的家系遗传模型：典型常染色体隐性模型示意参数连锁分析方法对于孟德尔遗传病，易于比较清楚的知道该疾病的遗传方式、外显率、基因频率等指标，从而确定一个准确的遗传模型进行连锁分析。某些遗传模型并不清楚的疾病也通过改变策略而适用于连锁分析，但相对准确的模型建立是参数连锁分析成功的基本条件。最常用的参数连锁定位方法：直接计分法和LOD值法。 1. LOD值法首先针对某一疾病收集一定数量的家系资料，进行分离分析，确定遗传模型。 2. 通过文献检索了解其可能的决定性状的染色体区域，并对该区域的SNP进行查询和筛选，基于选定的SNP，对该家系成员进行SNP分型。以LOD值法为例介绍参数连锁分析方法 3. 通过连锁分析估计疾病与SNP在子代中重组的