基于gbs技术构建xxx相关案例遗传图谱.docVIP

基于gbs技术构建xxx相关案例遗传图谱.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于gbs技术构建xxx相关案例遗传图谱

基于GBS技术构建XXX遗传图谱 目 录 1 研究背景 3 3 GBS构建XXX遗传图谱 7 3.1 实验策略 7 3.1.1 DNA样本要求 7 3.1.2 样本的选取 7 3.1.3 建库策略 7 3.1.4 测序策略 7 3.2 技术路线 9 4 信息分析 10 4.1 数据质控 10 4.2 与参考基因组比对 11 4.3 SNP标记检测及筛选 12 4.4 亲本之间多态性分析 13 4.5 子代基因分型 13 4.6 标记筛选 13 4.7 构建遗传图谱 14 4.8遗传图谱质量评估 15 5 项目周期及指标 17 6 相关案例 18 1 研究背景 通过选取合适的限制性内切酶结合高通量群体测序构建SNP分子标记,可用于群体进化分析、高密度遗传图谱构建、QTL定位、以及辅助基因组组装连接染色体等领域。 利用传统的标记,构建的图谱精细度较低,本研究拟采用结合高通量测序技术和生物信息分析技术,对两个亲本和100个群体进行高通量测序,检测最新且最有效的分子标记SNP,构建高质量的遗传图谱,从而用于定位。构建遗传图谱 GBS技术路线 GBS 技术流程如图1所示,主要包括三个部分: 1)实验部分:电子酶切评估,根据物种、科研目的选择合适内切酶,样本检测合格后建库,于HiSeq2500测序平台上测序; 2)标准信息分析:原始测序数据经过基本质控后,与参考基因组进行比对,进行变异检测及筛选; 3)高级信息分析:包括亲本间多态性分析、子代基因分型、标记筛选、遗传图谱构建等分析。 图1 GBS 技术路线 2.2 本项目信息分析内容 信息分析内容:数据质控(去除接头和低质量数据)、GBS tag产出数据统计;与参考基因组进行比对、SNP检测、遗传图谱构建、其他定制化分析(QTL定位等)。 2.3 GBS实验策略 2.3.1 文库构建及测序 GBS文库构建,首先应用限制性内切酶对基因组进行酶切,加上带有barcode的接头后,对每个样品进行扩增,然后对样品进行混合,选择需要的片段进行文库构建。利用Illumina HiSeq2500测序平台,进行双末端Paired-End125测序: 1) 酶切:0.1-1μg基因组DNA用限制性内切酶进行酶切,以得到适合的marker密度; 2) 加P1和P2接头:酶切后的片段两端加 P1和P2 Adapter(可与酶切DNA缺口互补);? 3) 片断选择:PCR扩增两端分别含有P1和P2接头的tag序列,DNA片段pooling,电泳回收需要区间的DNA; 5) 高通量测序:Cluster制备,上机测序。 图2 GBS 实验流程 3 信息分析 .1 数据质控 文库质控:对文库的插入片段及污染进行评估,保证文库的整体质量; 测序质控:原始测序数据中会包含接头信息,低质量碱基,未测出的碱基(以N表示),这些信息会对后续的信息分析造成很大的干扰,通过精细的过滤方法将这些干扰信息去除掉,最终得到的数据即为有效数据; RAD tag分析:分析有效RAD tag数量与平均测序深度等。分析有效 tag数量与平均测序深度等。 数据统计:结果包括测序reads数量,有效数据产量(包含酶切序列的高质量数据),测序错误率,Q20,Q30,GC含量等;测序数据指标:Q20%=90%,Q30%=85%。 通过以上严格的质控过程得到数量及质量都达标的数据,用于后续的分析。 图4 测序GC含量、错误率、质量分布图 表1.亲本测序数据产出统计 Novogene N. Raw reads Raw base(G) Clean base(G) Error rate(%) Q20(%) Q30(%) GC(%) 0.02;0.03 98.40;96.97 94.57;92.55 35.59;35.60 0.02;0.03 98.30;97.00 94.29;92.55 36.26;35.70 图5 子代数据产量分布 .2 与参考基因组比对软件,将两个亲本的数据分别和参考序列进行比对,对和覆盖度进行统计,查看研究的种和已经发表的参考序列的相似程度,如果较低(%)则将亲本的数据进行tag聚类及局部组装,作为参考序列。 图6 RAD的contig组装结果长度分布 3.3 SNP标记检测及筛选 SNP(单核苷酸多态性)主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性, 包含单个碱基的转换、巅换等。采用SAMtools进行个体SNP的检测,每个SNP的碱基支持情况不同,对亲本SNP深度进行分布统计,结果示例如图所示。为了降低SNP检测的假阳性,对SNP进行深度过滤。 父本母本 图SNP深度分布 .4 亲本之间多态性分析 Type Paternal genotype Maternal geno

您可能关注的文档

文档评论(0)

wangsux + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档