人全基因组高通量测序数据质量评价方法.pdfVIP

  • 75
  • 0
  • 约6.89千字
  • 约 9页
  • 2024-02-07 发布于河南
  • 举报

人全基因组高通量测序数据质量评价方法.pdf

人全基因组高通量测序数据质量评价方法

1范围

本文件规定了人全基因组高通量测序数据质量评价方法涉及的术语和定义、质量要求、评价方法。

本文件适用于使用高通量基因测序技术对人类基因组DNA样本进行全基因组测序的数据质量评价。

本文件不适用于Sanger测序技术和单分子测序技术,不适用于人体样本的从头测序、单体型测序、

人体肿瘤组织样本测序,也不适用于人类样本中含有的动物、植物、病毒、细菌、寄生虫等测序。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T29859-2013生物信息学术语

GB/T30989-2014高通量基因测序技术规程

GB/T35537-2017高通量基因测序结果评价要求

GB/T35890-2018高通量测序数据系列格式规范

YY/T1723-2020高通量基因测序仪

GA/T1693-2020法庭科学DNA二代测序检验规范

3术语和定义

下列术语和定义适用于本文件。

3.1

高通量测序high-throughputsequencingormassivelyparallelsequencing

能一次并行几十万到几十亿条核酸分子序列测定技术,又称大规模平行测序,特点是测序读长较短。

[GB/T35890-2018,3.1,有修改]

3.2

人全基因组高通量测序humanwholegenomesequencing

对人类不同个体或群体进行全基因组测序。

注:包括人的23对染色体核酸序列、线粒体核酸序列。

3.3

1

接头adapter

用于标记和固定待测序片段的已知序列的DNA片段。

[GA/T1693-2020,3.9,有修改]

3.4

PCR-free文库PCR-freelibrary

不依赖PCR扩增过程而直接构建的测序上机文库。

注:聚合酶链式反应polymerasechainreaction(PCR)是一种体外酶反应技术,通过DNA聚合酶反应将特定DNA片

段进行指数扩增,以使其拷贝数增加几个数量级。

3.5

PCR文库PCRlibrary

区别于3.4,经过一定循环数的PCR扩增过程而构建的测序上机文库。

3.6

标签或条码barcodeorindex

一段特征性的脱氧核苷酸段片段,在多样本混合测序时,充当识别特定样本来源的唯一编号。

[GA/T1693-2020,3.10,有修改]

3.7

碱基识别质量百分比percentageofbasecallquality

碱基识别质量在规定阈值以上的测序碱基个数占测序碱基总数的百分比,通常以Q20、Q30等表示。

3.8

GC含量GCcontent

测序片段碱基中鸟嘌呤和胞嘧啶的加和数量占所有嘌呤碱基(腺嘌呤和鸟嘌呤)和嘧啶碱基(胸腺

嘧啶和胞嘧啶)总数量的百分比。

3.9

数据过滤datafiltering

对原始测序片段进行去除低质量、N碱基、接头污染及其他任何不符合下游分析要求的测序片段的

处理过程。

3.10

测序原始碱基数据量sequencingrawbase

测序后未经数据过滤的碱基总数,简称原始数据量。

3.11

人参考基因组序列humanreferencegenomesequence

公开发布供参比的人全基因组序列,如hs37d5、hg38、hg19等。

3.12

基因组比对率mappingreadsrate

2

比对到人参考基因组序列的测序片段占总体有效测序片段的百分比。

3.13

有效测序深度effectivesequencingdepth

经过数据过滤、序列比对、去重后获得的一个全基因组测序样本

文档评论(0)

1亿VIP精品文档

相关文档