- 17
- 0
- 约1.68万字
- 约 18页
- 2017-02-10 发布于北京
- 举报
全外显子组测序分析中预处理方法和变异识别方法的比较
全外显子组测序分析中预处理方法和变异识别方法的比较闫瑾, 潘琦, 任红(重庆医科大学附属病毒性肝炎所,重庆 400010)【摘要】目的研究在外显子组数据分析中,使用不同的预处理方法和变异过滤方法对变异识别的影响。方法采用FASTX-Toolkit、Trimmomatic作为预处理方法,修饰后不同的不匹配读长(single-end reads)取舍策略,以及硬过滤(hard filter)和变异质量得分重新校正(VQSR)作为变异过滤方法对两例全外显子组数据进行变异识别,通过数据覆盖深度(DP)、识别变异的数目、Ti/Tv值和基因型一致性等数据进行比较其效果。结果Trimmomatic预处理后的读长的测序覆盖深度与未预处理的原始数据接近,但明显高于FASTX-Toolkit预处理方法。当DP≥10×、基因型质量分数(GQ)≥20时,经Trimmomatic预处理后识别到的SNV数量比FASTX-Toolkit高,与未预处理组接近。当包含single-end读长时,FASTX-Toolkit组多识别的SNV数量高于 (28%)Trimmomatic组 (5%)。当样本量较少时,在所有试验组中硬过滤方法滤掉的SNV要少于VQSR。结论Trimmomatic修饰(过滤)原始序列更温和,而FASTX-Toolkit可能过度过滤了原始数据。保留single-end读长有利于下游变异识别。硬过滤相较于变异质量得分重新校准表现出更高的容忍度。[关键词] 全外显子组测序;预处理;变异识别[中图法分类号] R857.3;Q344+.12Comparison of methods for pre-processing and variants filtering in analyzing whole exome sequencing dataYan Jin, Pan Qi, Ren Hong(Institute for Viral Hepatitis,Chongqing Medical University, Chongqing,400010,China)【Abstract】 ObjectiveTo investigate how different methods for pre-processing and variants filtering affect variants calling.Method Through the calculation of depth of coverage, number of variants, Ti/Tv ratio and non-reference concordance, we compare the effect of FASTX-Toolkit and Trimmomatic in preprocessing the exome data, the strategies of single-end inclusion and ‘Hard’ filter and variants quality score recalibration (VQSR) in variants filter by using whole exome sequencing data from two test samples.ResultTrimmomatic pre-processed reads showed similar depth of coverage to reads those without pre-processing, but significantly greater than those by FASTX-Toolkit pre-processed reads. With depth of coverage ≥10× and genotype quality ≥20, the number of called SNVs identified by Trimmomatic was greater than FASTX-Toolkit, but similar to those without pre-processing. With the inclusion of single-end reads, the number of variants increased significantly for FASTX-Toolkit pre-processing (~28%) than Trimmomatic pre-processing (~5%). In the all settings, ‘Hard’ filtering filtered less SNVs than VQSR filt
您可能关注的文档
- 全国计算机一级考试汉字编码选择题复习.docx
- 压缩系统盘C盘WINSXS文件夹步骤.doc
- 压贴温康纳岗位作业指导书.doc
- 压铸工工资方案.doc
- 全国计算机一级考试选择题含解析和答案合并.doc
- 压风自救系统管理制度最新.doc
- 全国计算机一级选择题真题集.doc
- 厚膜集成电路丝网印刷工艺技术.doc
- 厚街会计培训我国注册会计师职业道德失范的原因及对策研究金账本会计.doc
- 原产地证书学习资料大全.doc
- 安徽省华师联盟2025-2026学年高三上学期1月质量检测生物试卷+答案.doc
- 安徽省华师联盟2025-2026学年高三上学期1月质量检测语文试卷+答案.doc
- 四川省绵阳南山中学实验学校2025-2026学年高三上学期1月月考数学含答案.doc
- 2026届辽宁省大连市高三上学期双基考试物理试卷+答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测化学含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测生物含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测英语含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测政治含答案.doc
- 黑龙江省龙江教育联盟2026年1月高三上学期期末考试化学含答案.doc
- 黑龙江省龙江教育联盟2026年1月高三上学期期末考试生物含答案.doc
最近下载
- 湖南交通职业技术学院单招《数学》真题及参考答案详解(新).docx VIP
- 儿科护士年终工作总结.pptx VIP
- 第二章新时代新征程中国共产党的使命任务-2024版研究生新中特教材课件.pdf VIP
- 1资产评估执业准则——资产评估方法(征求意见 ….docx VIP
- 浙江省杭州市钱塘区2023-2024学年六年级上数学期末试卷(含答案).pdf VIP
- 利雅路燃烧机安装使用说明书GM1400-4500-cn.pdf VIP
- 第二章新时代新征程中国共产党的使命任务-2024版研究生新中特教材课件.pptx VIP
- 人教版九年级物理下册期末试卷(可打印).pdf VIP
- 湖北省黄冈市2022—2023学年九年级上学期数学期末教学质量监测试题【含答案】.pdf VIP
- EMERSON艾默生 European Instruction Manual Series WSNF Solenoid M12-II说明书用户手册.pdf
原创力文档

文档评论(0)